algorithms for romanizing arabic names

24
ﺳﻌﻮد اﳌﻠﻚ ﺟﺎﻣﻌﺔ ﳎﻠﺔ م، ١٧ ، واﳌﻌﻠﻮﻣﺎت اﳊﺎﺳﺐ ﻋﻠﻮم ص ص، ١ - ٢٣ ) اﻟﺮﻳﺎض، ١٤٢٥ ﻫـ/ ٢٠٠٤ م( 1 اﻟﻌﺮﺑﻴﺔ اﻷﺳﻤﺎء ﻟﺮوﻣﻨﺔ ﺧﻮارزﻣﻴﺎت اﻟﻐﺎﻣﺪي ﻣﺤﻤﺪ ﺑﻦ ﻣﻨﺼﻮر اﻟﺮﻳﺎض واﻟﺘﻘﻨﻴﺔ، ﻟﻠﻌﻠﻮم ﻋﺒﺪاﻟﻌﺰﻳﺰ اﳌﻠﻚ ﻣﺪﻳﻨﺔ ﻟﻠﻨﺸﺮ م ﻗﺪ) ١٦ / ٠٥ / ٢٠٠٤ ﻟﻠﻨﺸﺮ وﻗﺒﻞ م؛١١ / ١٢ / ٢٠٠٤ ( م. اﻟﺒﺤﺚ ﻣﻠﺨﺺ اﻟﺮوﻣﺎﱐ اﳊﺮف إﱃ اﻟﻌﺮﰊ اﳊﺮف ﻣﻦ اﻟﻌﺮﺑﻴﺔ ﻟﻸﲰﺎء اﻟﻜﺘﺎﰊ اﻟﻨﻘﻞ ﻋﻤﻠﻴﺔ ﺗﺸﻜﻞ ﻟﻜ ﻣﻌﻀﻠﺔ اﳉﻮﻳﺔ اﳋﻄﻮط ﻛﺎت وﺷﺮ اﳉﻮازات ﻛﻤﻮﻇﻔﻲ اﻟﻌﺮﺑﻴﺔ اﻷﲰﺎء روﻣﻨﺔ ﳎﺎل اﻟﻌﺎﻣﻠﲔ ﻣﻦ ﺜﲑ ﻣﻌﻴﺎر ﺗﻮﻓﺮ ﻋﺪم: اﻷول اﻟﺴﺒﺐ: ﻟﺴﺒﺒﲔ وذﻟﻚ واﻟﺒﻨﻮك، اﻟﺘﻌﻠﻴﻤﻴﺔ اﳌﺆﺳﺴﺎت اﻟﺘﺴﺠﻴﻞ وإدارات إ ﻟﻌﺪم ﺗﻄﺒﻴﻘﻪ ﺻﻌﻮﺑﺔ ﻫﻨﺎك اﳌﻌﻴﺎر ﻫﺬا ﺗﻮﻓﺮ ﻋﻨﺪ ﺣﱴ أﻧﻪ: اﻟﺜﺎﱐ واﻟﺴﺒﺐ ﻟﻠﺮوﻣﻨﺔ، ﻣﻮﺣﺪ ﻫﺆﻻء ﳌﺎم. اﻟﺮوﻣﺎﱐ ﺑﺎﳊﺮف ﺑﺎﻟﻜﺘﺎﺑﺔ واﻵﺧﺮ اﻟﻌﺮﰊ ﺑﺎﳊﺮف ﻳﺘﻌﻠﻖ ﺑﻌﻀﻬﺎ ﻷﺳﺒﺎب اﻟﺮوﻣﻨﺔ ﻣﻌﻴﺎر ﺑﺘﻄﺒﻴﻖ اﳌﻮﻇﻔﲔ ﻋﻦ ﻧﺘﺞ اﻟﺬي اﻟﻌﺮﺑﻴﺔ اﻷﲰﺎء ﻟﺮوﻣﻨﺔ اﳌﻮﺣﺪ اﳌﻌﻴﺎر ﺻﺪور ﺑﻌﺪ اﻷول اﻟﺴﺒﺐ ﲡﺎوز وﻗﺪ اﻟﻌﻠﻤﻴﺔ اﻟﻨﺪوة اﻟﻌﺮ ﻟﻸﲰﺎء اﻟﻜﺘﺎﰊ اﻟﻨﻘﻞ ﻣﻌﺎﻳﲑ ﺗﻮﺣﻴﺪ ﺣﻮل اﻷوﱃ اﻷﻣﻨﻴﺔ اﻷﺑﻌﺎد: ﺑﻴﺔ ﻣﻦ ﳎﻤﻮﻋﺔ اﻟﻮرﻗﺔ ﻫﺬﻩ وﺗﻘﺪم. ﺗﺘﻮﱃ ﺑﺮﳎﻴﺎت ﻟﻜﺘﺎﺑﺔ أﺳﺎﺳﺎ اﻟﻘﻮاﻋﺪ ﻫﺬﻩ ﻌﺘﱪ وﺗ. إﻟﻴﻪ اﳌﺸﺎر اﳌﻮﺣﺪ اﳌﻌﻴﺎر ﺑﺘﻄﺒﻴﻖ اﻟﻜﻔﻴﻠﺔ اﳋﻮارزﻣﻴﺎت. آﻟﻴﺎ اﻟﻌﺮﺑﻴﺔ ﻟﻸﲰﺎء اﻟﺮوﻣﻨﺔ ﻋﻤﻠﻴﺔ

Upload: mansour-m

Post on 02-Jan-2017

250 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Algorithms for Romanizing Arabic Names

)م٢٠٠٤/هـ١٤٢٥، الرياض(٢٣ -١، ص ص علوم احلاسب واملعلومات، ١٧، م جملة جامعة امللك سعود

1

خوارزميات لرومنة األسماء العربية

منصور بن محمد الغامدي مدينة امللك عبدالعزيز للعلوم والتقنية، الرياض

م)١١/١٢/٢٠٠٤م؛ وقبل للنشر يف ١٦/٠٥/٢٠٠٤(قدم للنشر يف

تشكل عملية النقل الكتايب لألمساء العربية من احلرف العريب إىل احلرف الروماين ملخص البحث.ثري من العاملني يف جمال رومنة األمساء العربية كموظفي اجلوازات وشركات اخلطوط اجلوية معضلة لك

وإدارات التسجيل يف املؤسسات التعليمية والبنوك، وذلك لسببني: السبب األول: عدم توفر معيار ملام هؤالء موحد للرومنة، والسبب الثاين: أنه حىت عند توفر هذا املعيار هناك صعوبة يف تطبيقه لعدم إ

املوظفني بتطبيق معيار الرومنة ألسباب بعضها يتعلق باحلرف العريب واآلخر بالكتابة باحلرف الروماين. الندوة العلمية وقد مت جتاوز السبب األول بعد صدور املعيار املوحد لرومنة األمساء العربية الذي نتج عن

. وتقدم هذه الورقة جمموعة من بية: األبعاد األمنيةاألوىل حول توحيد معايري النقل الكتايب لألمساء العر اخلوارزميات الكفيلة بتطبيق املعيار املوحد املشار إليه. وتعترب هذه القواعد أساسا لكتابة برجميات تتوىل

عملية الرومنة لألمساء العربية آليا.

Page 2: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

2

. المقدمة١احلرف العريب حىت لو كان يسمعه للمرة عريب ب١ال جيد الكاتب العريب صعوبة تذكر يف كتابة أي اسم

األوىل. ويعود ذلك لعاملني: األول، أن الكتابة العربية تقوم على النطق غالبا؛ مبعىن أن االسم يكتب هي عالقة متطابقة إىل حد grapheme ٣والقرافيم phoneme ٢كما ينطق وأن العالقة بني الفونيم

على سبيل املثال. العامل الثاين، أن الكتابة العربية وهذا عكس لغات أخرى كاإلجنليزية، -بعيد ٦دون عالمات التشكيل consonants ٥اليت غالبا ما متثل الصوامت ٤املعاصرة تقتصر على احلروفمما يعفي الكاتب من التدقيق يف الصوائت والرتكيز فقط على vowels ٧اليت غالبا ما متثل الصوائت

يعرف بالنقل الكتايب عند كتابة االسم العريب باحلرف الروماين وهو ماالصوامت. إال أن األمر خيتلف

) حممد نصر الدين. أما الكلمة فهي ٤) عبد اهللا، (٣) روضة خرمي، (٢) كمال ، (١يقصد باالسم يف هذه الورقة كامل االسم، مثل: ( .١

) ٣) و (٢) يتكون من كلمة واحدة واالمسني يف (١مفردة واحدة من االسم، وتكون إما جزءا من االسم أو كامل االسم؛ فاالسم يف () هو االسم األول للشخص وليس امسه ٤) يتكون من ثالث كلمات؛ الحظ أن االسم يف (٤ن كل منهما من كلمتني، واالسم يف (يتكو

واسم أبيه.لفرق الفونيم: هو أصغر وحدة صوتية تغري املعىن يف الكلمة ، فالكلمة "الطور" تتكون من ستة فونيمات: /ء ــ ط ط ـــ ر/ . ويظهر هنا ا .٢

ت الكتابة العادية للكلمة السابقة وبني كتابتها صوتيا لتمثيل الفونيمات. يف هذه الورقة، عند كتابة رمز أو رموز للداللة على األصوابنيا توضع بني خطني مائلني //. -الفونيمات –اللغوية فإ

تكون من سبعة قرافيمات: "ا ل ط و ر". وتكتب القرافيم: أصغر رسم مستقل يستخدم يف الكتابة ، فالكلمة السابقة "الطور" ت .٣خمتلفة: "ء ، ئ ، ؤ ، إ ، أ". هذه الرموز اخلمسة هلا متثيل صويت واحد يف -قرافيمات -يف العربية خبمسة أشكال –كفونيم –اهلمزة

ا توضع بني عالميت الدماغ وهو الفونيم /ء/. يف هذه الورقة، عند كتابة احلروف للداللة على الرموز اليت تس تخدم يف الكتابة العربية فإ اقتباس "".

حرفا وهي: "ا ، آ ، أ ، إ ، ئ ، ؤ ، ء ، ى ، ة ، ب ، ت ، ث ، ج ، ح ، خ ، د ، ذ ، ر ، ز ، س ، ٣٦احلروف العربية عددها .٤ روف اليت نستخدمها يف الكتابة.ش ، ص ، ض ، ط ، ظ ، ع ، غ ، ف ، ق ، ك ، ل ، م ، ن ، هـ ، و ، ي". هذه هي مجيع احل

صامتا، وهي مجيع احلروف العربية عدا: الواو املسبوقة بضمة والياء املسبوقة بكسرة. أما احلروف: " ا ، ٢٨الصوامت: عددها يف العربية .٥ة" إما أن تنطق /ت/ وميثلها آ، أ ، إ ، ئ ، ؤ ، ى ، ة ". فهي زائدة أي أن هناك رموز غريها متثل الصوت نفسه. فعلى سبيل املثال، "

الرمز "ت" أو أن تنطق /هـ/ وميثلها الرمز "هـ". مبعىن آخر، ال متثل "ة" صوتا خمتلفا عن الصوامت الثمان والعشرين يف العربية. عالمات التشكيل: ، ، ، ، ، ، ، . .٦المسبوق بكسرة، واأللف المسبوق بفتحة، والضمة، والكسرة، الصوائت العربية هي: الواو المسبوق بضمة، والياء .٧

ـ ، ــ ، ــ ، ــ /، على التوالي. والفتحة. ويرمز لها صوتيا: / ـــ ، ـــ ، ــ

Page 3: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

3

transliteration؛ إذ جند تباينا واضحا عند كتابة األمساء العربية حبروف اللغات اليت تستخدم ٨أن االسم Googleاحلرف الروماين يف الكتابة. وقد أظهرت نتيجة البحث باستخدام حمرك البحث

يظهر اختالفا جليا يف احلروف –وهو من أكثر األمساء شيوعا يف العامل ومن أقدمها -العريب "حممد" ). فرغم قدم استعمال هذا االسم وكثرة استخدامه إال أنه يكتب بطرق ١املستخدمة لرومنته (اجلدول:

التباين قدمي متعددة ولكل منها شيوع يف االستخدام مما يربز التباين يف رومنة األمساء العربية وأن هذا قدم بداية رومنة االسم العريب نفسه.

: تكرار ورود النقل الكتابي لالسم "محمد" بالحرف الروماني ١الجدول

. Googleباستخدام محرك البحث التكرارالنقل الكتابيالتسلسل

]١[ Muhammad ٢,٢٨٠,٠٠٠ ]٢[ Mohammed ٢,٠٠٠,٠٠٠ ]٣[ Mohamed ١,٦٠٠,٠٠٠ ]٤[ Mohammad ١,١٥٠,٠٠٠ ]٥[ Muhammed ٣٨٨,٠٠٠ ]٦[ Mohamad ٢٦٤,٠٠٠ ]٧[ Muhamed ٦٩,١٠٠ ]٨[ Muhamad ٤٤,٦٠٠

ويعود السبب هلذا التباين يف النقل الكتايب لألمساء العربية باحلرف الروماين لعدة عوامل، منها:

بأن يوضع بأنه: "حتويل نظام الكتابة للغة ما إىل نظام آخر للغة أخرى transliterationالنقل الكتايب ]١[يعرف ديفيد كريستال . ٨

بأنه: "استنساخ حروف لغة ما ]٢[لكل رمز للكتابة يف اللغة األوىل رمز آخر يقابله يف نظام الكتابة للغة اهلدف." ويعرفه رمزي بعلبكي حبروف لغة أخرى".

Page 4: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

4

العريب عن نظريه يف اللغات اليت تستخدم sound systemاختالف النظام الصويت )١فونيما يف العربية ليس هلا نظري يف اإلجنليزية ٢١على سبيل املثال، هناك احلرف الروماين؛ ف

]٣[. مل تكن للمستشرقني والرحالة الغربيني األوائل الذين كتبوا عن العامل العريب دراية دقيقة )٢

ا. مما جعلهم يعتمدون يف النقل الكتايب لألمساء العربية على نطق باللغة العربية وأصوام الشخصية. لذا جند كاتب كـ املتحدثني با للهجات العامية يف تلك العصور مث اجتهادا

، ومرة Jiddaمرات أخرى: ٦، و Jeddahمرة: ٢٥"لورنس" يكتب مدينة "جدة" ، ]٤[م ١٩٢٦يف الكتاب نفسه الذي نشره للمرة األوىل عام Jeddaواحدة يكتبها:

. هذا Jaddahية السعودية وهو ومجيعها ختتلف عن االسم املعتمد يف اململكة العرباالختالف يف كتابة األمساء العربية استمر بعد ذلك على مبدأ أنه ليس هناك نظام ميكن

٩وضعه للنقل الكتايب بني احلرف العريب واحلرف الروماين؛ فيذكر "لورنس" يف الصفحة نقال دقيقا، بسبب من املرجع السابق ما نصه: "ال ميكن نقل األمساء العربية إىل اإلجنليزية

وصوائتها اليت كصوائتنا ]يقصد صوامت اللغة اإلجنليزية[صوامتها اليت ختتلف عن صوامتنا ختتلف من مكان إىل آخر".

أن اسم العلم العريب قد يأيت مفردا كما يف "سليمان" وقد يأيت مركبا كما يف "أبو داوود" )٣لالسم املركب، وهذا يزيد من صعوبة و "عبد اهللا" مع وجود مسافة بني الكلمتني املكونة

الرومنة؛ إذ جند االسم العريب املركب يرومن مرة بكلمة واحدة وأحيانا بكلمتني منفصلينت . Abdu Allah, Abdu-allah, Abdullahوبأشكال خمتلفة:

عند كتابة األمساء العربية باحلرف العريب فإنه غالبا ما تكتب باحلروف دون عالمات )٤ا جيعل بعض األمساء موقع لبس يف نطقها كما يف "محيد" الذي ميكن أن ينطق التشكيل مم

"محيد" و "محيد"؛ "سعد" و "سعد". هذا االختالف ينتقل إىل احلرف الروماين فيجعل االسم الواحد يكتب بأكثر من طريقة.

Page 5: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

5

ونغرس، ونظام ؛ فهناك نظام مكتبة الك]٧، ٦، ٥[كثرة معايري النقل الكتايب وتباينها )٥األمم املتحدة، ونظام دائرة املعارف اإلسالمية، ونظام قاموس فهر، ونظام املنظمة العاملية

الندوة العلمية األوىل حول توحيد معايري النقل . من أجل ذلك عقدت ISOللمقاييس هـ. وأوصت ١٤٢٤، جبامعة نايف العربية للعلوم األمنية عام الكتايب: األبعاد األمنية

.]٣[ستخدام منوذج مقرتح لكتابة األمساء العربية باحلرف الروماين با

والنقل الكتايب ألمساء األعالم ال يقتصر على األمساء العربية، فهو قائم بني اللغات باختالف أصوهلا ونظمها الصوتية وأساليبها يف الكتابة. إال أن النقل الكتايب بني اللغات اليت تستخدم احلرف

كتابة عادة ما يكون أيسر منه عندما ختتلف حروف كتابتها. فالنقل الكتايب أقل تعقيدا بني نفسه يف ال، على سبيل املثال، ألن مجيعها تستخدم احلرف الروماين. ةالفرنسية واألملانية واإلجنليزية والفنلندي

Antonioوغالبا ما تكون كتابة اسم العلم هي نفسها يف أي من هذه اللغات، فنجد امسا مثل: . إال أن األمر يصبح أكثر تعقيدا عندما ]٨[يكتب كما هو يف أي من هذه اللغات سالفة الذكر

، وكما هو كذلك بني ]١٠، ٩[خيتلف احلرف والنظام الصويت كما هو قائم بني اإلجنليزية والصينية لنظام الروماين إال أن النقل . أما يف اليابانية فرغم اختالف نظامها الكتايب عن ا]١١[العربية واإلجنليزية

الكتايب لألمساء اليت تكتب باحلرف الروماين إىل اليابانية يكون باستخدام ألفبائية خاصة بالنقل الكتايب . ]١٢[غري تلك اليت تستخدم يف كتابة اللغة اليابانية، وهذا يسهل إىل حد ما عملية النقل الكتايب

رمز -فونيم –الكتابة العربية فونيمية، حيث لكل صوت وختتلف نظم كتابة اللغات، فحيث جند أن أي أن لكل مقطع syllabicقرافيم. إال أننا جند لغات أخرى كالصينية هلا نظام مقطعي –كتايب

رمز خاص به. فعلى سبيل املثال، لكل مقطع من املقاطع التالية رمز مستقل خاص به: /ك ــ/ ، /ك ــ/ االحتماالت األخرى املكونة للمقاطع من صوامت وصوائت مما جيعل عدد ، /ك ــ/ ويقاس على ذلك

وهذا يزيد من تعقيد النقل الكتايب بني هذين ]١٠[القرافيمات يصل إىل ما يقرب من ستة آالف رمز النوعني من اللغات إال إذا استحدثت ألفبائية لغرض النقل الكتايب كما هو بالنسبة لليابانية.

Page 6: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

6

ج الباحثو ن طرائق شىت يف عملية النقل الكتايب ختتلف بناء على اللغات اليت يتعاملون وقد معها واألسلوب الذي يرونه أنسب للخروج مبا يرونه حلوال ناجعة ملا بني أيديهم من بيانات ألمساء أعالم أو مصطلحات. فقام "جارمو توي فونني" وآخرون باستخدام القوانني التحويلية

transformation rules يف عملية النقل الكتايب ألمساء األعالم واملصطلحات بني لغات مجيعها. حيث ]٨[والفرنسية إىل اإلجنليزية ةيستخدم احلرف الروماين كاألملانية واألسبانية والسويدية والفنلندي

يف yيف األسبانية يقابلها iaتستخلص القوانني التحويلية آليا من القواميس. فعلى سبيل املثال، ، على التوايل. فيكون القانون somatologyو somatologiaاإلجنليزية كما يف "علم اجلسد"

. ومل تكن نسبة الدقة باستخدام هذه الطريقة يف النقل الكتايب عالية. ia yهو: التحويلي هناالسبب يف %. ويعود٧٢فعلى سبيل املثال، نسبة النقل الكتايب الصحيح من الفنلندية إىل اإلجنليزية

kansleriذلك إىل كثرة احلاالت اليت ليس هلا قانون ثابت كما يف: "وزير املالية" بالفنلندية . chancellorوباإلجنليزية

واستخدم باحثون آخرون القوانني اليت تتوىل حتويل القرافيمات يف لغة كالصينية إىل رموز صوتية القوانني هنا ضرورية حىت يكون النقل الكتايب أقرب . ف]١١[مث حتويلها بعد ذلك إىل حروف رومانية

ما يكون لنطق الصوت بلغته األصلية، وحىت تفك رموز الكتابة الصينية اليت تقوم على الكتابة املقطعية وال تعتمد على األلفبائية كما هي احلال بالنسبة للحرف الروماين.

عامل االحتمالية الذي يقوم على ]١٣، ٩[ومن طرق النقل الكتايب اإلحصاء probability ا يف هذه احلالة، يكون . وهذه الطريقة كسابقتها تعتمد على قواعد البيانات، إال أ

هناك أكثر من شكل للنقل الكتايب للكلمة الواحدة. وتعتمد هذه الطريقة على الشكل األكثر شيوعا. البحث على شبكة اإلنرتنت. فعلى وتكون قاعدة البيانات إما قواميس إلكرتونية أو استخدام حمركات

، هي ١سبيل املثال، االحتمالية املرشحة للنقل الكتايب لالسم "حممد" املذكور يف اجلدول: Muhammad فاحتماليتها تساوي ،P=0.29 ،وهي أعلى من احتمالية ورود األشكال األخرى ،

ه الطريقة أن . ويعاب على هذP=0.25هي Mohammedحيث احتمالية الكلمة اليت تليها الكلمة األكثر شيوعا ليست دائما هي الصحيحة. فعلى سبيل املثال كلمة "مكة" وردت رومنتها

Page 7: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

7

Makkah مرة عند البحث عنها يف ١٦٠,٠٠٠Google بينما وردت بالشكلMecca مرة، رغم أن الرومنة األوىل هي الصحيحة واملعتمدة. ١,١٥٠,٠٠٠

القائمة اآلن ما تعتمد على قواعد البيانات أي أنه يتم إدخال ومن طرق رومنة األمساء العربية االسم يدويا باحلرفني العريب والروماين للمرة األوىل وعند وروده فيما بعد فإن النظام يستدعي االسم

. ويف هذه احلالة فإنه ال بد أن يكون مدخل االسم على ]١٤[الذي سبق ختزينه يف قاعدة البيانات ومنة األمساء العربية وعلى دراية كذلك بنطق االسم. إال أن هذا النوع من النظم يعتمد دراية بقواعد ر

ا ال تفرق بني األمساء عند على اجتهاد مدخل البيانات مما جيعل الرومنة عرضة للخطأ إضافة إىل أاء تطابقها يف احلروف واختالفها يف التشكيل كما يف: "حسيب" و "حسيب" وغريها من األمس

ة . ويف كل مرة يرد اسم جديد يتطلب من يرومنه ويضيفه إىل قاعدة البيانات.]١٥[املتشاا كلمات جمهولة ]١٦[عاجل "سنها" ا أحد unknownsأمساء األعالم على أ وعرفها بأ

ال بد أنواع الكلمات اليت ال حيويها املعجم؛ مبعىن أن األمساء من الكلمات اليت ليس هلا معىن ومن مث من معاجلتها عند الرتمجة بأن تنقل كتابيا وال ترتجم. ففي مرحلة التحليل الصريف للكلمات أثناء عملية الرتمجة اآللية يستبعد احمللل الصريف الكلمات اليت ليس هلا جذور يف قاعدة بيانات اللغة وتعامل هذه

ا أمساء تنقل كتابيا وال ترتجم. الكلمات على أ Hidden Markovبرجميات خمتلفة لتنفيذ عملية النقل الكتايب؛ ومنها وقد استخدمت

Model اليت استخدمت يف حتويل حروف أمساء األعالم من اإلجنليزية إىل الكورية اليت تتطابق فيها artificial neural. كما استخدمت الشبكة العصبية الصناعية ]١٧[األصوات مع احلروف

networks ١٨[العربية متهيدا لرومنتها يف تشكيل األمساء[. وبغض النظر عن طريقة النقل الكتايب املتبعة، فإن مجيعها ال بد أن حتوي عنصر نطق االسم بلغته األصلية وليس فقط كتابته وقد أشارت مجيع املراجع السابقة إىل استخدامها هلذا العنصر بشكل

ثالثة عناصر أساسية ال بد من توفرها يف أي أو بآخر. هذا يعين أن عملية النقل الكتايب تتكون من ):١نظام للنقل الكتايب (الشكل

Page 8: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

8

االسم مكتوب حبرف اللغة األصلية، وهو االسم املراد نقله كتابيا. هذا االسم إما أن العنصر األول: يدخل يدويا أو يكون ضمن قاعدة بيانات ألمساء األعالم.

تم حتويل االسم من الكتابة بلغته األصلية إىل كتابة صوتية الكتابة الصوتية، وفيها ي العنصر الثاني:تقوم على نطق االسم وليس على كتابته. وهذه العملية تعرف باسم "من القرافيم إىل الفونيم"

grapheme-to-phoneme" فعلى سبيل املثال، احلرف .s يف االسم اإلجنليزي املشهور "Charles / ينطقz/ وليس /sوتيا حسب نطقه. وعندما يكتب باحلرف العريب / ومن مث يكتب ص

" هنا ال يكتب مقابلها "س" عند كتابة هذا االسم باحلرف sفإنه يكتب "تشارلز"، ويالحظ أن "ا تنطق هكذا بلغة االسم األصلية. وعند كتابة االسم بالعربية Knightالعريب ولكن "ز"، وذلك أل

هنا يف الكتابة ال تؤخذ يف احلسبان؛ وإمنا النطق، لذا فإنه يكتب "نايت" فالقرافيمات املستخدمةا ال تنطق وإال كان النقل الكتايب هلذا االسم هكذا: "كناغهت"، k g hحتذف احلروف الالتينية: أل

وهذا ال حيدث. وغالبا ما تكون الرموز املستخدمة يف الكتابة الصوتية هي األلفبائية الصوتية الدولية International Phonetic Alphabet ويرمز هلا اختصاراIPA وتضم أكثر من مئة رمز متثل

ذه األلفبائية كتابة أي اسم بغض النظر عن لغته.]١٩[مجيع أصوات اللغات البشرية . وميكن

كتابة االسم حبروف اللغة اهلدف أو ما يعرف بـ "من الفونيم إىل القرافيم" العنصر الثالث:phoneme-to-grapheme ويتم يف هذه املرحلة حتويل الكتابة الصوتية إىل قرافيمات اللغة .

اهلدف، حيث يتم اختيار القرافيم الذي صوته ميثل أقرب نطق لصوت رمز الكتابة الصوتية حبيث يكون هناك أكرب قدر ممكن من التشابه إما يف خمرج الصوت أو يف طريقة إخراجه أو فيهما معا. فعلى

إىل العربية فإننا نكتبه: "ريدنغ"، ذلك ألن Readingالنقل الكتايب السم املدينة: سبيل املثال، عند/ من اللهاة حيث يشرتك مع الصامت العريب /غ/ يف نفس ŋخمرج الصامت األخري يف هذا االسم /

املخرج ولو أن األول أنفي واآلخر فمي رخو، إال أن هذا هو الصوت األقرب له.

Page 9: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

9

اإلنجليزية إلى العربية، وآخر من مراحل النقل الكتابي مع التوضيح بمثال للنقل الكتابي السم من .١ الشكل العربية إلى اإلنجليزية.

وال بد من اإلشارة إىل أن عملية التحويل من الفونيم إىل القرافيم ليست آلية صرفة مبعزل عن

phonologicalللقوانني الفونولوجية خصائص اللغة اهلدف، إذ ال بد أن خيضع النقل الكتايب

rules ٩والفونوتكتيكية phonotactic rules للغة اهلدف؛ فاالسمClinton حيتوي على صامتنيklويكتب صوتيا / –املقطع األول –يف بداية الكلمة ntn/وعند نقله كتابيا إىل العربية فإننا ١٠

الصائت /ــ/ بني /ك/ ، /ل/ رغم أنه غري موجود يف نكتبه /كـلـنـتـون/ وهكذا ننطقه. وقد أدخلنا

ة .٩ وات اللغ ة بأص ة: خاص وانين الفونولوجي وتي phonemesالق ا الص وانين sound systemونظامه . والقة الفونوتكتيكي د في بداي ورود صامت واح ة ال تسمح إال ب ة العربي ة؛ فاللغ د أصوات اللغ ة: خاصة بتسلسل عناقي

ل /ع/ ، ا ال تسمح بتسلسل بعض الصوامت مث ى أنه ه، إضافة إل المقطع ولكنها تسمح بتسلسل صامتين في نهايتة صوامت /ح/. ونجد في المقابل أن نظام عناقيد الصوامت في اللغة اإلنجليزية يسمح بتسل ى حد ثالث سل يصل إل

. streetفي بداية المقطع كما في " في االسم إلى ما يعرف بالحرف المقطعي n" ال ينطق وإنما يتحول الحرف األخير "o. الحظ أن الحرف "١٠

syllabic.

حروف اللغة الكتابة الصوتية األصلية

حروف اللغة الهدف

Knight nait نايت

’Sajma:? Shaymaa شيماء

Page 10: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

10

االسم بلغته األصلية وذلك لكون اللغة العربية ال تسمح بورود صامتني متتاليني يف بداية املقطع؛ وهذا ما يعرف بالساكن يف بداية الكلمة. وأدخلنا الصائت الطويل قبل احلرف األخري ألن اللغة العربية ال

مت متتالية يف أي موقع من املقطع. جتيز ورود ثالثة صوا . الطريقة٢

تتوىل هذه الورقة وضع القواعد التحويلية لألمساء العربية من احلرف العريب إىل الروماين بتطبيق معايري النقل الكتايب املشار إليها يف الندوة العلمية األوىل حول توحيد معايري النقل الكتايب ألمساء

).١عاد األمنية (امللحق: األعالم العربية: األباملتعلقة بتحويل الكتابة ]٢٠[سيكون هناك جتاهل لبعض القوانني الفونولوجية الواردة يف

العادية إىل كتابة صوتية، ذلك لكون النقل الكتايب متثيال للقرافيمات مع األخذ يف االعتبار عامل انون اإلقالب ال يطبق هنا وال يتحول االسم النطق. فعلى سبيل املثال، عند متثيل االسم "عنرب" فإن ق

’. Anbarوإمنا يبقى مطابقا للحروف العربية فيكتب ’. Ambarإىل "عمرب" ليصبح عند الرومنة يتحول –على سبيل املثال –ويرتك عامل تأثري األصوات على بعضها للغة اهلدف. ففي اإلجنليزية

/n/ إىل/m/ عندما يتبعه/b/: n → m / - b

/، هذا يعين أن هذا القانون الفونوجلي موحد يف fam-beltاليت تنطق / fan beltكما يف كلمة اللغتني اإلجنليزية والعربية، على األقل.

وحىت تتم عملية النقل الكتايب بشكل دقيق مع األخذ يف احلسبان مجيع االحتماالت املمكنة مت عملية النقل الكتايب إىل أربع مراحل: مبا يف ذلك إدخال الكلمات العربية، فقد قس

المرحلة األولى: معالجة النص العربي:

وتتم يف هذه املرحلة عملية مراجعة القرافيمات املدخلة والتأكد من الكتابة السليمة هلا خاصة وأن من املستحيل مالحظة األخطاء يف كتابة بعض القرافيمات العربية. فعلى سبيل املثال، ال ميكن

Page 11: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

11

دراك تكرار طباعة حركة بعينها على احلرف نفسه، فلو تكررت طباعة الفتحة على حرف الكاف يف إا ال تغري من شكل الكلمة يف شيء. إال أنه عند معاجلة الكلمة أو كلمة "كتب" عشرات املرات فإا شكل مستق ل حماولة رومنتها فإن الربجميات ستنظر إىل كل مرة أدخلت فيها الفتحة على أ

character وهلذا السبب وألسباب تتعلق باخلط العريب وكتابته كاملد يف كلمة مثل "أمحـــد"، فإن هذه .املرحلة ضرورية لتهيئة النص للمرحلة التالية وهي الكتابة الصوتية. والقواعد املطلوب تنفيذها يف هذه

املرحلة هي: ربية، وتكتب صوتيا؛ مثل:وضع قاعدة بيانات باألمساء املستثناة يف كتابتها بالع )١

ه "اهللا" ) أ الال طاها "طه" ) ب ياسني "يسني" ) ت

التأكد من أن مجيع احلروف مشكلة أي أن كل حرف متبوع بأحد احلركات التالية فقط: )٢ "أمحد" " " الفتحة: ) أ "سهام" " " الكسرة: ) ب "بـتول" " " الضمة: ) ت نمار""س " " الشدة + الفتحة: ) ث "سريع" " " الشدة + الكسرة: ) ج "سلوم" " " الشدة + الضمة: ) ح "صفي" " " (فقط يف آخر االسم) الشدة منفردة ) خ "عدنان" " " السكون: ) د

واحلروف التالية هي الوحيدة املستثناة من التشكيل، ويف حالة وجودها مشكلة فيحذف

تشكيلها: بت، لما""مساء، الس "ا"

Page 12: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

12

"آمال" "آ" "علوش" إذا كان مسبوقا بضمة "و" "عليم" إذا كان مسبوقا بكسرة "ي" إذا كان مسبوقا بـ "ا" يف بداية الكلمة ومتبوعا حبرف "ل"

"السماء" عليه شدة. يعترب التشكيل التايل غري صحيح ويعدل: )٣

فسه كفتحتني أو وجود أكثر من تشكيل على احلرف الواحد سواء كان من ن ) أ خمتلفا كضمة يتبعها سكون، ويستثىن من ذلك الشدة وما يتبعها من حركات.

وجود التنوين على حرف غري احلرف األخري من الكلمة، فاخلطأ هنا يف إدخال ) باية الكلمة. التشكيل؛ إذ ال يكون التنوين إال يف

قها.إذا سبقت الشدة حركة. فاألصل أن تتبع احلركة الشدة وال تسب ) ت حتذف مدود احلروف "ـ" ، كما يف "حمــــــــمد" اليت تصبح "حممد". )٤ على احلرف األخري من كل كلمة. -عدا الشدة –حتذف مجيع عالمات التشكيل )٥ حيذف التشكيل لو أتى قبل احلرف األول من الكلمة. )٦رية تضاف ضمة " " على آخر حرف يف كل كلمة من األمساء املركبة عدا الكلمة األخ )٧

("مشس الدين").

المرحلة الثانية: قواعد الكتابة الصوتية "من القرافيم إلى الفونيم":ويتم يف هذه املرحلة حتويل الكتابة العادية باحلرف العريب إىل كتابة صوتية باستخدام احلرف العريب

ضرورة أيضا، ذلك ألن احلرف العريب حيتوي على مجيع الفونيمات العربية ومن مث ليس هناك . IPAالستخدام الرموز الصوتية الدولية

)/ءزز مل/ / إذا كان غري مشكل ("الزامل" "ل" .١ /شهد/) ("شهد" " " .٢

Page 13: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

13

/). عببــد / يكرر احلرف الذي يسبقها ("عباد" " " .٣ )/ءمحد/ ("أمحد" "ء " "أ " .٤

)/ءبر هـم/ راهيم" ("إبـ ء " " "إ" )/لءي/ ("لؤي" ء" " "ؤ" )/ر ءد/ ("رائد" ء "" "ئ"

)/مء ثر/ "ء ــ ــ" ("مآثر" "آ" .٥/ إذا كان يف بداية كلمة مسبوقة بكلمة أخرى ("نصر "ا" .٦

/نصر دد ن/) الدين" )/صــلح/ ن آخر ("صالح" / يف أي مكا "ــ"

)/فـطمه/ ("فاطمة" / يف آخر االسم "هـ" "ة" .٧ )/رمحت للــه/ ("رمحة اهللا" / يف أي مكان آخر "ت"

)/عه◌د/ / إذا كان مسبوقا بضمة ("عهود" ــ"" "و" .٨ )/مخـس/ يس" / إذا كان مسبوقا بكسرة ("مخ ــ"" "ي" .٩

۱١)/شذ◌/ ("شذى" "ى" .١٠

المرحلة الثالثة: قواعد الرومنة؛ "من الفونيم إلى القرافيم":الندوة العلمية األوىل حول توحيد معايري النقل تطبق يف هذه املرحلة القواعد اليت خلصت إليه

ذه املرحلة حتويل كامل احلروف العربية إىل حروف ). وتتم يف ه١(امللحق: الكتايب: األبعاد األمنية رومانية.

تى يمكن ح a. من توصيات ندوة النقل الكتابي أن تحول األلف المقصورة والفتحة التي تسبقها إلى صائت قصير ١١

. aaالتمييز بينها وبين األلف الممدودة كما في "شذا" التي يصبح فيها األلف والفتحة التي تسبقها

Page 14: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

14

المرحلة الرابعة: قوانين ما بعد الرومنة:تقوم هذه املرحلة مبعاجلة النقل الكتايب لألمساء حىت ينسجم مع كتابة األمساء باحلرف الروماين،

ة والفصل بني أداة مع تطبيق بعض القواعد اخلاصة بعملية النقل الكتايب كحروف الصوائت الطويل التعريف واالسم. وتتكون من القواعد التالية:

‘Abdullaahتدمج الكلمات املكونة لألمساء املركبة يف كلمة واحدة: "عبد اهللا" تصبح .١ الشرطة واحلروف الكبرية: .٢

" متبوعا بـ:a" إذا بدأ االسم األخري بعد رومنته بـ "-توضع الشرطة " . أ .assaalim as-salim: احلرف نفسه مكرر، كما يف .ashshamsaan ash-shamsaanحرفني مكررين، كما يف: .almuslim al-muslim"، كما يف: lاحلرف الروماين "

:capitalizationقواعد تكبري احلروف . بيكون احلرف األول يف الكلمة حرف كبري إذا مل يكن يف الكلمة شحطة

aalمسلم اليت ترومن ، كما يف: آلaal" وال تكن الكلمة -"

Musallam .

-asاحلرف األول الذي يلي الشحطة إن وجدت يف االسم، كما يف:

Saalim وash-Shamsaan.

إذا أتيا يف بداية "‘" أو العني "’" احلرف األول الذي يلي رمزي اهلمزة ‘.Aleeو "علي" ترومن ’ madhAالكلمة، كما يف: "أمحد" ترومن

الية:حتويل احلروف الت .٣

Hamiid Hameedكما يف: ii ee . أ Humuud Humoodكما يف: uu oo . ب

Page 15: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

15

وللتأكد من عمل اخلوارزمات السالفة الذكر فقد قام الطالب / منصور الوائلي بكتابة برجميات

، وميكن بواسطة هذه الربجميات Visual Basicحاسوبية لتنفيذها باستخدام لغة الفيجيول بيسك ). الربجميات متوفرة على ٢االسم العريب من احلرف العريب إىل احلرف الروماين (الشكل حتويل كتابة

وميكن تنزيلها واستخدامها. http://www.mghamdi.com/A2R.zipالرابط: ) ومعاجلتها كذلك ٣ومما تقوم به الربجميات املذكورة معاجلة األمساء العربية قبل رومنتها (الشكل

sourceأ االسم حبرف كبري. وميكن كذلك اإلطالع على كامل شفرة الربجميات بعد الرومنة كأن تبد

code :بالدخول على الرابط http://www.mghamdi.com/A2R_SC.zip.

.Faysal. واجهة االستخدام أثناء تحويل االسم العربي "فيصل" إلى ٢الشكل

Page 16: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

16

سماء العربية وتشكيلها قبل رومنتها.. تحتوي شفرة البرمجيات على معالجة لأل٣الشكل

. النتائج والتوصيات٣عرضت هذه الورقة جمموعة من اخلوارزميات الكفيلة بتحول األمساء العربية من احلرف العريب إىل احلرف الروماين. وميكن استخدامها كذلك مع بعض التعديالت لوضع خوارزميات معاكسة تقوم

ف الروماين إىل احلرف العريب. ولتطبيق اخلوارزميات املعروضة يف هذه بتحويل األمساء العربية من احلر يعرض لبعض األمساء العربية واملراحل اليت متر ٢الورقة ومعرفة املدخل واملخرج لبعضها، فإن اجلدول:

فيها عند تطبيق اخلوارزميات املذكورة لتحويل هذه األمساء من احلرف العريب إىل احلرف الروماين.

. تطبيق قواعد الرومنة على أربعة أسماء عربية. يرمز "م" إلى المرحلة ويرمز الرقم الذي يليه إلى رقم ٢ول الجد القاعدة تحت تلك المرحلة.

٤االسم ٣االسم ٢االسم ١االسم القاعدة علي ركن الدين محـــاد عبد القدير

محاد ٤: ١م ركن الدين يرعبد القد ٥: ١م

Page 17: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

17

القاعدة ٤االسم ٣االسم ٢االسم ١االسم

علي ركن الدين محـــاد عبد القدير ركن الدين عبد القدير ٧: ١م ركن ادين ١: ٢م ركن ادين عبد القدير ٢: ٢م ركن اددين محماد ٣: ٢م ركن ددين محم◌د عبد لقدير ٦: ٢من عبد لقد ر ٩: ٢م عل ركن دد abdu lqadiir hammaad ruknu ddiin ‘alii‘ :٣م abdulqadiir ruknuddiin‘ ١: ٤م Abdulqadiir Hammaad Ruknuddiin ‘Alii‘ ٢: ٤م Abdulqadeer Ruknuddeen ‘Alee‘ ٣: ٤م

كيف تنتقل األمساء العربية من مرحلة إىل أخرى إىل أن تصبح ٢وتبني عينة األمساء يف اجلدول

الروماين، مع مالحظة أن خمرجات قانون ما هي املدخلة للقانون الذي يليه. يف شكلها النهائي باحلرف مبعىن آخر، أن اخلوارزميات املعروضة هنا متسلسلة التطبيق.

وخنلص إىل القول بأننا قد وضعنا يف هذه الورقة جمموعة متكاملة من القوانني الكفيلة بتنفيذ رمسا ٤لعريب إىل احلرف الروماين. ونقدم يف الشكل عملية النقل الكتايب ألي اسم عريب من احلرف ا

ختطيطيا لنظام حاسويب مقرتح ميكن عند االنتهاء منه أن يقوم بعملية متكاملة لرومنة األمساء العربية كموظفي اجلوازات والبنوك وشركات -آليا. مما سيسهل على العاملني يف جمال رومنة األمساء العربية

دقة عالية تزيل اللبس والتعددية يف رومنة األمساء العربية يف املستندات أداء عملهم ب –اخلطوط والبطاقات الدولية كاجلوازات وبطاقات االئتمان وتذاكر السفر ورخص قيادة السيارات وغريها.

ويتكون النظام املقرتح من العناصر التالية:

Page 18: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

18

قاعدة البيانات ويف حالة كونه يقارن االسم املدخل باألمساء الشاذة يف معالجة الحرف العربي: )١أحدها تعاد كتابته ليكون مطابقا لنطقه، وهو ما أشري إليه سابقا يف الفقرة واحد من املرحلة

األوىل. وعند توفر حملل صريف عريب، فإنه ميكن التأكد من صحة االسم العريب املدخل. طأ يف تشكيل االسم التأكد من صحة تشكيل األمساء وأنه ليس هناك خ مراجعة التشكيل: )٢

املراد رومنته، يؤخذ يف االعتبار ما ورد سابقا حتت املرحلة األوىل: معاجلة النص العريب.حتول حروف كتابة االسم إىل رموز صويت باستخدام احلرف العريب والقواعد الكتابة الصوتية: )٣

الواردة حتت املرحلة الثانية: الكتابة الصوتية.احلرف العريب إىل ما يقابله من احلرف الروماين حسب املعيار املستخدم حيول هنا النقل الكتابي: )٤

الندوة العلمية األول حول للنقل الكتايب. وقد استخدم يف هذه الورقة ما اتفق عليه املؤمترون يف . توحيد معايري النقل الكتايب ألمساء األعالم العربية: األبعاد األمنية

ا إخراج االسم بشكله املقبول باحلرف الروماين مبا يف ذلك يتم هن معالجة الحرف الروماني: )٥ تكبري وتصغري احلروف.

صممت هذه العناصر حبيث تكون كل مرحلة مستقلة عن املراحل األخرى مما يسهل االنتقال من مرحلة إىل أخرى ويسهل التعديل داخل كل مرحلة حسب املستجدات والتعديالت اليت قد تطرأ

الكتايب لألمساء العربية يف املستقبل. على معايري النقلوختاما فقد قدمت هذه الورقة جمموعة من اخلوارزميات تتوىل حتويل األمساء العربية من احلرف العريب إىل احلرف الروماين آخذة يف االعتبار كل االحتماالت املمكن ورودها ووضع حال هلا. وقدمت

تنفيذه برومنة األمساء العربية آليا. الورقة كذلك مقرتحا لنظام حاسويب يقوم عند

مراجعة التشكيل

معاجلة احلرف العريب

الكتابة الصوتية

النقل الكتايب

األمساء الشاذة

قواعد التشكيل

االسم باحلرف العريب

حملل صريف

قواعد الكتابة الصوتية

قواعد النقل الكتايب

Page 19: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

19

. رسم تخطيطي مقترح لنظام رومنة األسماء العربية.٤ الشكل

شكر وتقديريتقدم كاتب هذه الورقة بالشكر والعرفان لوزارة الداخلية وجلامعة نايف العربية للعلوم األمنية

Page 20: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

20

ا ورعايتها ندوة توحيد معايري النقل الكتايب. وملدينة امللك وللمنظمة الدولية للشرطة اجلنائية لتنظيمهعبد العزيز للعلوم والتقنية الشكر ملا قدمته من تسهيالت ودعم هلذه الورقة. وأتقدم بالشكر للدكتور/ عبد امللك السلمان لتفضله بقراءة مسودة هذه الورقة وللمالحظات القيمة اليت أبداها مما أنعكس على

ائي للورقة وما ورد ضمنها.الشكل النه

١الملحق: ١١نموذج رومنة األسماء العربية

يكتب االسم متسلسال (من االسم األول إىل األب مث اجلد فاللقب) ويكتب رباعيا كلما .١

أمكن ذلك ويوضع ("ابن" أو "بنت" أو "ولد") بني االسم األول والثاين وذلك للتفريق . bn, bt, wdوتكتب عند الرومنة بني األمساء املركبة واملفردة

.عدم األخذ باإلعراب عند كتابة االسم .٢وال ammadu hMuوليس ammad hMu مثال: حممد

ammadunhMu ، وذلك بضم مكونات األمساء املركبة. تعامل األمساء املركبة والكىن معاملة االسم املفرد .٣

Abuqays, Sharafuddeen الدين مثال: أبو قيس ، شرف تعامل الـ التعريف حسب نطقها (ختتلف الشمسية عن القمرية): .٤

as-Saalim, al-Muslim مثال: السامل واملسلم تعامل آل بطريقة خمتلفة عن الـ التعريف: .٥

aal Saalim, as-Saalim آل سامل و السامل :مثال تكتب التاء املربوطة حسب نطقها إما هاء أو تاء: .٦

Hibah, Hibatullah بة ، هبة اهللا مثال: ه

ة. من توصيات: ١١ اد األمني ة: األبع ابي ألسماء األعالم العربي ل الكت ايير النق د مع ى حول توحي . الندوة العلمية األول

. ٣٨٣-٣٨١ هـ) أكاديمية نايف العربية للعلوم األمنية.١٤٢٤(

Page 21: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

21

تكرر احلروف املشددة: .٧ Bassaam مثال: بسام

تعامل األلف املقصورة كالفتحة: .٨ Layla مثال: ليلى

:األمساء حبسب نطقهاتعامل .٩ aahaaT طهمثال:

:واحلركات احلروف .١٠ اين:هلا ما يقابلها صوتيا يف احلرف الروماليت احلروف العربية أ.

سلسل أمثلة بالحرف الحرفالت

الروماين العريب الروماين العريب Badr بدر b ب ١ Tameem متيم t ت ٢ Ja‘farجعفر j ج ٣ Daawood داود d د ٤ Raamee رامي r ر ٥ Zaydزيد z ز ٦ Saameeسامي s س ٧ Faarisفارس f ف ٨ Kamaalكمال k ك ٩

Laylaليـلى l ل ١٠ Muraadمراد m م ١١ Noohنوح n ن ١٢ Hudaهدى h هـ ١٣ Waleedوليد w و ١٤ Yaasirياسر y ي ١٥

Page 22: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

22

:اليت ليس هلا ما يقابلها صوتيا يف احلرف الروماينواحلركات العربية احلروف ب.

سلسلالت

أمثلة بالحرف الحرف اينالروم العريب الروماين العريب

Sahar سحر a ــ ١

Imaad‘ عماد i ــ ٢

Qusay قصي u ــ ٣

Saalih صالح aa اــ ٤

Eed‘ عيد ee يــ ٥

Moosaموسى oo وــ ٦

’Shaymaaشيماء ay ـي ٧

Awf‘عوف aw ـو ٨

Ahmad’أمحد ’ ء ٩

Thaabitثابت th ث ١٠

Hassaanحسان h ح ١١

Khaalidخالد kh خ ١٢

Dheebذيب dh ذ ١٣

Shawqeeشوقي sh ش ١٤

Safiyyahصفية s ص ١٥

Dubaybضبـيب d ض ١٦

Taahaaطه t ط ١٧

ية z ظ ١٨ Zabyahظبـ

Abdullaah‘عبد اهللا ‘ ع ١٩

Ghaazeeغازي gh غ ٢٠

Qaysقـيس ق ٢١

Page 23: Algorithms for Romanizing Arabic Names

خوارزميات لرومنة األمساء العربية

23

المراجع]١[ Crystal, David. A Dictionary of Linguistics and Phonetics. Fifth Edition. Blackwell Publishing.

2003.

م.١٩٩٠بعلبكي، رمزي. معجم املصطلحات اللغوية. دار العلم للماليني. بريوت. ]٢[

. ألبعاد األمنيةالندوة العلمية األوىل حول توحيد معايري النقل الكتايب ألمساء األعالم العربية: اتوصيات ]٣[ هـ.١٤٢٤. ٣٨٣أكادميية نايف العربية للعلوم األمنية. الرياض. ص

]٤[ Lawrence, T. E. Seven Pillars of Wisdom. Doubleday, 1991.

توحيد معايري النقل الكتايب ألمساء األعالم القتم، عبد اهللا. األمناط املتبعة يف كتابة األمساء الشخصية. ]٥[ هـ. ١٤٢٤. ١١٦-٩٧. أكادميية نايف العربية للعلوم األمنية. الرياض. األمنية العربية: األبعاد

م.١٩٩٥القتم، عبد اهللا. كتابة األمساء العربية باحلروف الالتينية. مطبوعات جامعة الكويت. الكويت. ]٦[النقل الكتايب بأمساء توحيد معايري صاحل، حممود بن إمساعيل. رومنة األمساء العربية يف املراجع األكادميية. ]٧[

هـ.١٤٢٤. ١٩٥-١٧٥. األعالم العربية: األبعاد األمنية]٨[ Toivonen, Jarmo, Ari Pirkola, Heikki Keskustalo, Kari Visala and Kalervo Jarvelin “Translating

Cross-lingual Spelling Variants Using Transformation Rules”. Information Processing and Management. in press, 2004.

]٩[ Virga, Paola and Sanjeev Khudanpur “Transliteration of Proper Names in Cross-language Applications. In: Proceedings of SIGIR , Toronto, Canada, 2003.

]١٠[ Meng, H.M., Wai-Kit Lo., Berlin, Chen and Tang, K. “Automatic Speech Recognition and Understanding”. ASRU 01. IEEE Workshop ( 9-13 Dec. 2001), 311- 314.

]١١[ Knight, k. and J. Graehl “ Machine transliteration”. In: Proceedings of ACL, 1997.

]١٢[ Stalls, B. and K. Knight “Translating Names and Technical Terms in Arabic Text”. In: Proceedings of the COLING/ACL Workshop on Computational Approaches to Semitic Languages, 1998.

]١٣[ Abduljaleel, Nasreen. “Statistical Transliteration for English-Arabic Cross Language Information Retrieval”. In: the Proceedings of TICIKM, New Orleans, USA, 2003.

توحيد احملتسب، حسين عبد الغين. نظام آيل لكتابة األمساء العربية حبروف إجنليزية: حنو معايري موحدة. ]١٤[ هـ.١٤٢٤. ١٩٥-١٧٥. معايري النقل الكتايب بأمساء األعالم العربية: األبعاد األمنية

الشمسان، أبو أوس إبراهيم. أمساء الناس يف اململكة العربية السعودية. جملة جامعة امللك سعود: اآلداب. ]١٥[ هـ.١٤١٧. ٤٢٥-٣٣١: ٩

]١٦[ Sinha, R.M.K. “Dealing with Unknown in Machine Translation”. IEEE International Conference on Systems, Man and Cybernetics, 2 (2001), 940 - 944.

]١٧[ Jung, S. Y., S. Hung and E. Paek “An English to Korean Transliteration Model of Extended Markov Window”. In: Proceedings of COLING, Saarbrucken, Germany, 2000.

]١٨[ Arbabi, M., S. M. Fischthal, V. C. Cheng and Bart, E. “Algorithms for Arabic Names Transliteration”. IBM Journal of Research and Development. 38 (1994), 183-193.

]١٩[ http://www2.arts.gla.ac.uk/IPA/ipa.html

Page 24: Algorithms for Romanizing Arabic Names

منصور بن حممد الغامدي

24

جملة جامعة امللك بية. الغامدي، منصور بن حممد وحسين احملتسب ومصطفى الشافعي. قوانني الفونوجليا العر ]٢٠[ هـ.١٤٢٤. ٢٤-١: ٦. سعود: علوم احلاسب واملعلومات

Algorithms for Romanizing Arabic Names

Mansour M. Al-ghamdi King Abdul Aziz City for Sciences and Technology,Riyadh

(Received 16 May 2004; accepted for publication 11 December 2004)

Abstract. People such as immigration personnel who work on the Romanization of Arabic names find it troublesome and sometimes confusing. One reason for such difficulty is that an Arabic name can be transliterated in different forms because of the absence of common standards. Another reason is that even if the transliteration of Arabic names is standardized, it is difficult for a layperson to implement it. The first obstacle has been overcome after the Symposium on Standardizing Arabic Name Transliteration: Security Dimensions which one of its outcomes was standardized measures for Arabic name transliteration. This paper is to provide algorithms based on the symposium standards that can be used in programming a system to transliterate Arabic names automatically.