Arabic-L:LING:Needs texts and translations for parallel corpus research

Dilworth Parkinson dilworthparkinson at GMAIL.COM
Tue Mar 5 17:43:03 UTC 2013


------------------------------------------------------------------------
Arabic-L: Tue 05 Mar 2013
Moderator: Dilworth Parkinson <dilworth_parkinson at byu.edu>
[To post messages to the list, send them to arabic-l at byu.edu]
[To unsubscribe, send message from same address you subscribed from to
listserv at byu.edu with first line reading:
           unsubscribe arabic-l                                      ]

-------------------------Directory------------------------------------

1) Subject:Needs texts and translations for parallel corpus research

-------------------------Messages-----------------------------------
1)
Date: 05 Mar 2013
From:Saad Alkahtani saad4200 at yahoo.com
Subject:Needs texts and translations for parallel corpus research

الأساتذة الكرام           حفظكم الله
السلام عليكم ورحمة الله وبركاته،،،

في الحقيقة أنا طالب دكتوراة في جامعة بانجور في بريطانيا والأن أنا أجمع
النصوص المترجمة وأقوم بتجزأتها إلى جملة مقابل جملة ثم لدي برنامج يقوم بوضع
كل جملة في ملف فيكون لدي مجموعة ملفات من العربي ومجموعة من الإنجليزي بعد
ذلك نقوم بأستخدام عدة معادلات إحصائية لمعرفة ما هي الطريقة الافضل من ناحية
أقل اخطاء من الامثلة على المعادلاة (PPM-Prediction by Partial Matching)
تجد شرح مفصل في الرابط الأسفل
http://compressions.sourceforge.net/PPM.html
وتجد في المرفق مثال على أحد النصوص المترجمة بعد تجزئته،
أما بالنسبة للنصوص فأنا اقوم بتصنيفها كالتالي:
1. News:
             News_0000001_ar.txt
             News_0000001_en.txt
             News_0000002_ar.txt
             News_0000002_en.txt
             ....
             ...
2. Economy.
3. Politics.
4. Religion.
5. Stories.
6. Sports.

بخصوص كمية النصوص فأنا احتاج إلى كمية كبيرة لأنه كلما كبرة الكمية كان أفضل
للتصحيح و أكثر دقة و جودة.
فأرجو منك مساعدتي بما لديكم من نصوص مترجمة سواءاً مقالات أو قصص أو كتب أو
أخبار أي ترجمة لديكم (أحتاج للنص العربي وترجمته بالأنجليزي أو العكس).
أتطلع لردكم.
 لكم منا كل الشكر والتقدير،،،،

وفقكم الله.
تحياتي
سعد القحطاني

--------------------------------------------------------------------------
End of Arabic-L: 05 Mar 2013
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/arabic-l/attachments/20130305/eb164047/attachment.htm>


More information about the Arabic-l mailing list