تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو ...

70
ي ب ر لع ط ا خ ل ى ا عل ي ب و ض ل ا رف ع ت ل ل ام ظ ن ر ي و ط نSYSTEM DEVELOPMENT FOR OPTICAL RECOGNITION ARABIC FONT دس ن ه م ل ور ا ت ك الد رو ك ب الد خ

Upload: dr-khaled-bakro

Post on 05-Apr-2017

132 views

Category:

Engineering


7 download

TRANSCRIPT

Page 1: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

تطوير نظام للتعرف الضوئي على الخط العربي

SYSTEM DEVELOPMENT FOR OPTICAL RECOGNITION ARABIC FONT

الدكتور المهندس

بكرو خالد

Page 2: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

مقدمة المعلومات أدت لتضخ��م ثورة المعلومات، واالتص��االت ف��ي

وتنظيمه���ا وتحليله���ا ومعالجته���ا به���ا اإلحاط���ة وضرورةالبشري��ة الطاقات بإمكان يع��د ل��م الذي األم��ر وفهرس��تها،

به . القيام قاعدة عل�ى أدوات�ه وتطوي�ر الحاس�وب، م�ع التعام�ل ضرورة

الوطنية .اللغة ف���ي االهتمام القراء���ة زاد لعملي���ة اآلل���ة محاكاة البحوث

لدى .والكتابة االنسان العربي�� أخذت والشركات والبحثي��ة العلمي��ة ةالمؤس��سات

هذه لالعم�ل لكون العربي�ة، اللغ�ة لخدم�ة الحاس�وب تطوي�ع:اللغة االنتشار واسعة قرابة .300يتحدثها عربي مليون قرابة بتع�لمها .1.2يهتم الناس من مليار حروفه��ا األخرى ف��ي تس��تخدم اللغات كالفارس��ية بع��ض

واألردو.

2

Page 3: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

Problem 1 المشكلة تعريف�Definition

األحرف عل�ى تعرف نظام إيجاد مشكل�ة تزال والنص�وص العديدة ألسباب التحقق بعيدة بأدائه وموثوق قوي .العربية

والقبول لالعتماد قابل��ة مرضي��ة لنتائ��ج الباحثون يص��ل ل��م. نهائي كحل

: أهمها من المشاكل من العديد بسبب المعطيات اس���تخالص الضجي���ج: مشكل���ة معالج���ة

والتشويه. : ص�عوبة تضي�ف العربي�ة الكتاب�ة خص�ائص اللغ�ة مشكل�ة

. والتعرف التقطيع لعملية المتص���لة الكلمات تقطي���ع الن���ص : مشكل���ة تقطي���ع

نهائي تأحرف لالمتصل حل دون مشكلة .مثل المميزات اختيار ف���ي المتعلق���ة بع���ض: المشكل���ة

ال جدا طويل مميزات شعاع تنتج .تقنيات

3

Page 4: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

Problem 2 المشكلة تعريف�Definition

:ال ب� يتعلق بما للتحسينات واسع مجال هناك يزال خطأ معدل و تخفيض .الكلمةالحرف الضجيج .معالجة المفتوحة المفردات قواعد على .العمل معينة لغوية بحصيلة التقيد .عدم واأل الحجوم متعدد نواع.الخط

الباحث يزال يعملون ال أداؤه�ا ون يكون تعرف أنظم�ة إيجاد عل�ى:تحقق بحيثجيد

تعرف • مرتفعة.نسبةأكبر • تعرف .سرعةالمس�تخدمة • المعلومات تقني�ة لتط�بيقات فعال وموثوق�ة مناس�بة

. اليومية األعمال في 4

Page 5: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

البحث Research Objectivesأهداف

: إلى البحث يهدف التعرف دراس����ة األحرف الضوئ����ي مشكل����ة عل����ى

.والنصوص المطبوعة العرب�ية عل���ى للتعرف متكام���ل نظام وتقيي���م وبناء تص���ميم

العربية والنصوص AOTRS األحرف

Arabic Optical Text Recognition Systemجيدة نتائج يحقق يعطي .بحيث منخفض خطأ معدل

5

Page 6: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

البحث Research Importanceأهمية

لمعالج�ة وجدت الت�ي األنظم�ة كون م�ن البح�ث أهمي�ة تنبث�قالعربية اللغة

واسع نطاق على تستخدم :ألنها لم العملي المجال في مناسبة حلوال توفر .ال العرب للمس��تخدمين العال��م ثقاف��ة تقدي��م تس��تطيع ،ال

للعالم العربية والثقافة اللغة .ونقل ب المتعلقة األكاديمية األبحاث حوسبتها.قلة صعوبات من التقنيات تلك مطوري يواجه .ما الن�ص عل�ى التعرف عل�ى قادرة تط�بيقات بناء ف�ي تأخ�ر

.العربي المس�توى دون الحالي�ة ال�برمجيات أحرزته�ا الت�ي النتائ�ج

.المطلوب6

Page 7: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

Researchمبررات البحثMotivations

العربي�ة النص�وص عل�ى التعرف ف�ي األكاديمي�ة األبحاث قل�ة.وتمييزها

المس��توى ا دون الحالي��ة ال��برمجيات أحرزته��ا الت��ي لنتائ��جالمطلوب.

فعال العربي��ة والنص��وص األحرف عل��ى للتعرف نظام إيجاددق�ة تتطل�ب الت�ي العمليات ف�ي اس�تخدامه يمك�ن وموثوق

عالية.

7

Page 8: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

Research( 1)البحثاسهامات Contributions

عل���ى عرض الضوئ���ي التعرف لمشاك���ل األحرف موس���عالعربية.النصوص و

عل��ى الضوئ��ي التعرف أنظم��ة ومراح��ل إلمكانيات عرض. العربية األحرف

الكائ�ن عل�ى تعتم�د الجديدة البح�ث م�ن ( Object)طريق�ة بدالالص��ورة ( pixel)البكس��ل تحلي��ل م��ن ف��ي التخل��ص بهدف

واإلحص�ائية الحس�ابية و العمليات المعقدة وقتا تس�تغرق الت�يالكل�ي، التنفي�ذ وزم�ن المعالج�ة زم�ن تقلي�ص وبالتال�ي طويال،

. الصورة على المسبقة المعالجة عمليات وتقليل الن��ص ةقوي�� تقني��ةتص��ميم ص��ورة أس��طر لص��ور لتقطي��ع

بشك�ل ومنفص�لة مقتطع�ة أحرف ص�ور إل�ى وص�وال وكلماتبقدرته�� تص��حيح، المتداخل��ة اتمي��ز األحرف تقطي��ع عل��ى

. البنيوية النصية التعقيدات ومعالجة والمتالمسة، و بس���يطة مجموع���ة لألحرف محددة اختيار المميزات م���ن

معدل م�ن األدن�ى الح�د تحقي�ق عل�ى والقادرة بدق�ة والمشتق�ة . والكلمات األحرف في الخطأ

8

Page 9: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

Research( 2)البحثاسهامات Contributions

عل���ى قادرة ودقيق���ة بس���يطة رياضي���ة عالقات تص���ميمالمميزات استخالص هذه .وتمثيل

واس��تخالص والتقطي��ع المس��بقة المعالج��ة مراح��ل دم��ج. متكامل واحد بنظام والتعرف المميزات

والنص���وص األحرف عل���ى الضوئ���ي للتعرف نظام تص���ميموالكلمات واألرقام األحرف تميي�ز عل�ى بقدرت�ه يتمي�ز العربي�ة

. العربية الترقيم وعالمات نظام وتقيي�م وتنفي�ذ ل بناء ص�ورة متكام�ل بتقطي�ع يقوم لتعر�ف

العرب�ي يتمي�ز لالن�ص عليه�ا، التعرف ث�م وم�ن وأحرف كلماتالتعدي���ل وقابلي���ة واالس���تخدام التص���ميم ف���ي بالبس���اطة

واالضافة. واال عملي��ة ماتالب التص��ميم برنام��ج باس��تخدام تم��ت ختبار

لغات أ�و الص�ورة لمعالج�ة تط�بيقات بأ�ي االس�تعانة دون فق�ط،. أخرى برمجيات أو برمجة

9

Page 10: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

Research( 3)البحثاسهامات Contributions

م�ن المؤلفة العربي�ة األحرف مجموع�ة استخدام حرف 28ت�م ) - - - - - - - -- ء ) ؤ ئ�� ئ ى ه ة إل� ال أل ال�ى إليه�ا باالضاف�ة وأضفن�ا

مجموع( آل��–آالتركي��بين) المعتمدة ليص��بح العربي��ة األحرف.40 للتعرف حرف

ف��ي جيدة نتائ��ج أعط��ت المقترح للنظام التجريبي��ة النتائ��جوص�ل حي�ث والتميي�ز إل�ى معدل الدق�ة % 98التعرف وس�طيا

الص�فحة ف�ي كامال عالمات% 99وال�ى ،للن�ص دون وس�طياالترقيم.

وبرمجيات أبحاث م��ع المقترح النظام ونتائ��ج مزاي��ا مقارن��ةأخرى.

وأي�ة االنجليزي�ة واألرقام األحرف عل�ى النظام تعرف إمكاني�ة. النص في موجودة أخرى رموز

اللغات عل���ى للتعرف المقترح النظام اس���تخدام إمكاني���ة.األخرى

10

Page 11: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

في عن ملخص األعمال أهمالمجال هذا وآخرون 2010عام المحتس����ب باس����تخدام ،[21] ، نظاما قدموا

المخفي���ة ماركوف النافذة HMM نماذج تقني���ة عل���ى يعتم���دم��ع نافذة، 16المنزلق��ة لك��ل لدق��ة مميزة التجريبي��ة النتائ��جحققت .%98.08التعرف

وآخرون 2012عام الجراح تقني�ة ، [22]، يعتم�د جديدا نظاما قدموامص����نف واس����تخدموا المميزات، م����ن وعدد جديدة تقطي����ع

باالضاف��ة الص��غرى، أج��ل لالمس��افة م��ن قاموس اس��تخدامحق��ق التعرف، دق��ة لتحس��ين الالحق��ة والمعالج��ة المراجع��ة

دقة . 96.1النظام القاموس% استخدام بع�د وآخرون 2012عام المص����لح دمج����ت ،[ 23] ، خوارزمي����ة قدموا

نافذة واس�تخدموا واحدة، معالج�ة خطوة ف�ي والتعرف التقطي�عال��ى وص��لت تعرف دق��ة وحققوا للمطابق��ة، الحج��م ديناميكي��ة

96.% وآخرون 2012عام رشاد تعرف [ 103]قدم دق����ة حق����ق نظاما

إل���ى االحص���ائية% 97وص���لت المميزات بع���ض باس���تخدام. مجاور أقرب ومصنف واللحظات

11

Page 12: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

الضوئي األحرف التعرف علىوأنواعه

12

ع�ن للحاس�ب المدخل�ة الن�ص ص�ورة تحوي�ل عل�ى تعتم�د تقني�ة. معه والتعامل تحريره يمكن مفهوم لشكل الماسح طريق

المتزامن ال - أنواعه أو المباشر - تعرفالمباشر غير التعرف

ا المتصلة األحرف أو المعزولة األحرف على الخط التعرف على لتعرفاليد المطبوع- خط على

التعرف أنظمة إمكانيات الشكل يوضحاألحرف على

Page 13: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

التعرف نظم أساليب األحرف على الضوئي

و تص�نف خالل أس�اليب طورت الت�ي المختلف�ة التعرف طرقأصناف أربعة إلى عام بشكل الماضية :[7]العقود

نموذج م:ع المراد مطابق:ة الحرف شك�ل مقارن�ة تت�م. مسبقا مخزنة للحروف نماذج مع عليه التعرف

إحص::ائية عدد مطابق::ة اس��تخالص فيه��ا م��ن ( N)يت��م ) قياسات ) للحروف.مواصفات

::بنيوي مكونات األحرف تجزأ لغوي::ة ةطرق إل��ى فيه��االوص�ل وطرق بمكونات�ه حرف ك�ل توص�يف ويت�م جزئي�ة

.بينها العصبونية الشبكات باستخدام التعرف

ولذل��ك- أس��لوب م��ن أكث��ر تجم��ع طرق اس��تخدام يمك��ن. التعرف دقة لزيادة 13

Page 14: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

وكفاءة عوامل جودةالعوام��ل OCRأنظمة م��ن بعدد األنظم��ة جودة م��ا تتعل��ق أهمه��ا م��ن

:[ 11]يلي : الخ���ط أ���و طبيع���ة المتراكب���ة األحرف ذات الخطوط

. لمشاكل تؤدي المتقاربة : الن�ص ال النص�وص جودة اإلضاء�ة ضعيف�ة ودرج�ة أ�و تباي�ن

عل�ى تحتوي التنس�يق ، ملحوظ�ةبق�ع الت�ي معقدة يكون أ�و. أكبر فيها الخطأ معدل

المس���ح أثناء االعتبار ف���ي أخذه���ا الواج���ب االحتياطات.الضوئي

. الورق وجودة األصل تاريخ.) نقطية ) أو ليزرية الطباعة طريقة. والتخطيط التظليل من األصل سالمة. التدريب معطيات قاعدة وحجم جودة 14

Page 15: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

ل النموذجية على المراحل التعرف نظامةالعربياألحرف

15

النص بعد صورة على ل الحصول للمراحل لحاسبوادخالها النظام يقسم[:3,4,7,8,9]التالية

للصورةالمسبقة المعالجة مرحلة (pre-processing). التقطيع (.Segmentation)مرحلة المميزات مرحلة .(Feature Extraction) استخالص والتعرف مرحلة (.Classification) التصنيف الالحقة المعالجة مرحلة (post-processing).

Page 16: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

أبحاث تأخرت OCRلماذا؟ العربي

في تبدأ للتالي أيمكن التأخر و 1975تقريبا يعزا :[3]ن. الكافي التمويل وجود عدم. العرب الباحثين بين التواصل ضعف دع�م ومجموعات دع�م وخدمات مؤس�سات وجود عدم

.عامة . العربي النص على التعرف في المتأخرة البداية العرب���ي الخ���ط مواص���فات ف���ي الخاص���ة التحديات

عل���ى الموجودة التقنيات تط���بيق يمك���ن ال وبالتال���ي. العربية الكتابة

16

Page 17: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

العربي OCRأنظمة تحديات

17

ت التحديات هذه : [3,12 ] كونأهم الحرف شكل حاالت تعدد .تحدي المقطع أو التراكب .تحدي التنقيط .تحدي. الوصل تحدي. التداخل تحدي . التشكيل تحدي. والحجم الشكل تنوع تحدي الكلمة مقاطع تعدد .تحدي النص ضمن الفراغات تنوع .تحدي. األساسي الخط يدعى واحد خط على الكتابة تحدي

Page 18: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

مرحلة المعالجة المسبقة

صورة

مرحلة التقطيع

مرحلة استخالص المميزات

مرحلة التعرف

النص العربي

النظام وتصميم المقترح تحليلالصورة- على الحصول بعد

المسبقة المعالجة صورة تحويل- مرحلة إلى الصورة. منطقية

التقطيع كل - مرحلة في الموجودة األسطر .صفحةاستحصالكلمات تقطيع - الى .األسطر - . لها المكونة األحرف مجموعة إلى كلمة كل تقطيع

. األحرف صور من المميزات استخالص مرحلة صور على التعرف . ةمرحلة وتمييزها الحرفالنصي - الملف توليد

للصور ة.المقابل

18

العام الصندوقي المخططالمقترح للنظام

Page 19: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

المفصل الصندوقي المخططالمقترح للنظام

19

طريق عن الصورة على الحصول عمليةالماسح

 

الصورة تقطيعأسطر  إلى

األسطر تقطيعكلمات  إلى

الكلمات تقطيعأحرف إلى

مرحلة المعالجة المسبقة

 

مرحلة التقطيع

استخالص من المميزاتاألحرف صور

النصي الملف  توليد

لنص صورةعربي

النص العربي

مرحلة استخالص المميزات

مرحلة التعرف

التصنيف  والتعرف

الصورة صورة لتحويلمنطقية

إلى الصورة تحويل رمادي

التباين ضبطمن الصورة وتحويل

أبيض لرمادي  وأسود

الصورة ألوان عكس 

Page 20: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

20

لمميزاتااستخلاص التعرفالتقطيعالمسبقةالمعالجةثلاثةوالتمييز

المقترح النظام عمل آلية

Features

Page 21: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

 المسبقة المعالجة مرحلة

PREPROCESSING STAGE : التالية العمليات المسبقة المعالجة مرحلة تتضمن أن يمكن

– – - كشف التنحيف والتنعيم الفلترة ثنائي الى التحويلكشف - – – الحجم تسوية الميالن تصحيح االنحراف وتصحيح

األساسي الخط

21

Binarization 

Thinning "Skeletonization"

Filtering and Smoothing Arabic text image

Skew Detection and Correction

Slant Correction

Pre-processing Stage

Normalization Size

Segmentation StageBaseline Detection

Page 22: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

 لمرحلة الصندوقي المخطط

المسبقة المعالجة

22

صورةلنص عربي

مرحلة التقط

يع

المعالجة مرحلةالمسبقة

من رماديالصورة تحويل إلى أبيض وأسود

عكس ألوان الصورة

 

تحويل الصورة تحويل رمادي إلى

الصورة إلى صورة

منطقيةBinarization 

Page 23: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

التقطيع SEGMENTATIONمرحلةSTAGE

.فصل هي- ألحرف والكلمات لكلمات األسطر - وقتا تستغرق والتي والحاسمة الصعبة المراحل من

.طويالالنهائي - التعرف معدل على كبير تأثير .ذاتعلى - التعرف أنظمة من العديد في الرئيس التحدي تمثل

العربية .األحرفالتعرف- ألخطاء الرئيس .[29,34]المصدر

باإلن�جليزية - مقارنة .صعبةأحرف الى والتقطيع الصفحة تحليل الى وتقسم

23

Page 24: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

( أسطر الى التحليل الصفحة تحليل(1وكلمات( )

: العتب::ة- طريق::ة الكالس::يكية بي��ن الطريق::ة الفص��ل يت��مالمس�افة متوس�ط قيمته�ا محددة عتب�ة باس�تخدام الن�ص خط�وط

األساسية الخطوط [.54,55]بين

األفق:ي- االس:قاط طريق:ة اس:تخداما األكث:ر الطريق:ة والعمودي:

الواق�ع الن�ص خ�ط ويعت�بر األفق�ي االس�قاط يوج�د األس�طر لتحدي�دالبكسل خطوط من كتلتين بين

الكثافة صفرية [4,29].

باإلسقاط ويتمتحديد العمودي

مقاطع أو الكلمات .PAWالكلمات

(Piece of Arabic Word ) ال:كلمة لنفس تنتمي المنطقة ال:كلمات هذه بين فصل منطقة

24

Page 25: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

( أسطر الى التحليل الصفحة تحليل(2وكلمات()

والعمودي أه::م األفق::ي اإلس::قاط طريق::ة محاس::ن[3,29,39,57]:

- استخداما األكثر حسابيا وفعالة للتنفيذ .وبسيطة -. الخطوط من أنواع بعض مع جيدة نتائج تعطي أن يمكن

. الحرف- حدود على للضجيج تحسسا أقلوالعمودي األفقي اإلسقاط طريقة مساوئ أهم

بعضه�ا- م�ن والقريب�ة المتداخل�ة األحرف م�ع التعام�ل عل�ى قدرته�ا عدمكثيرا.أ��و أحيانا يت��م- س��طرين العلوي��ة دم��ج النقاط ع��ن أ��و انفص��ال الس��فلية

األحرف.ف�ي - الضجي�ج لمعالج�ة المس�بقة، المعالج�ة عمليات م�ن العدي�د تتطل�ب

.الصورةال . - المقطع في كما الكلمات مقاطع بعض فصل الصعب من يكون

حساب- المستخدمة اقيمة عملية . لعتبة بقصير ليس وقتا تأخذوالعمليات- المس�بقة المعالج�ة عمليات لتعدد ك�بير معالج�ة زم�ن تتطل�بم��ن الك��بير والعدد والمعقدة، الك��بيرة والمقارنات واالحص��ائية الحس��ابية

. معها تتعامل التي البكسالتعملي�ة- يضع�ف مم�ا مقط�ع م�ن ألكث�ر مقطع�ة كلمات عل�ى الحص�ول يمك�ن

. الكلمة على التعرفالمعقدة تكون- النص��ية والتنس��يقات الوثائ��ق خص��ائص لبع��ض عرض��ة

.والضجيج 25

Page 26: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

أحرف الى الكلمات تقطيعالتقطي�ع تطورت - الماض�ي، طرق العق�د خالل ملحوظ بشك�ل

تقنيات .وظهرت متنوعة مخيبة - كانت إليها التوصل تم التي .النتائجابتعاد - س�بب ه�ي للتط�بيق قابل�ة عام�ة خوارزمي�ة وجود ص�عوبة

الت�ي التط�بيقات ف�ي تأخ�ر وبالتال�ي المجال، هذا ع�ن الباحثي�نالمرحلة هذه .تتطلب

دون - مشكل�ة يمث�ل أحرف إل�ى المتص�ل الن�ص تقطي�ع يزال ال[.29]نهائي حل

اثني�ن - تحديي�ن ف�ي الص�عوبة تكم�ن العربي�ة للكلمات بالنس�بةاألهم :يعتبران

حدود ايجاد عملي��ة م��ن يجع��ل األحرف بي��ن االتص��الصعب أمر .الحرف

. لموقعه وفقا تتغير والتي الحرف أشكال تعدد

26

Page 27: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

الكلمات لتقطيع المنجزة األعمال أهمأحرف إلى (1)العربية

ل�� ،[25]س�ارفاراز- الن�ص خ�ط -baseline -middleمناط�ق،3قس�مupper وبضع�ف األس�اسي الخ�ط منطق�ة فوق ه�ي المتوس�طة ،

م�ن الكلم�ة مس�ح ث�م له�ا، العمودي الهيس�توغرام أوج�د س�ماكته،األس�اسي الخط س�ماكة ثلث�ي م�ن أق�ل قيمة وأ�ي لليس�ار، اليمي�نبداي�ة تعت�بر أك�بر قيم�ة وأ�ي حرفي�ن، بي�ن وص�ل منقط�ة تعت�بر

. جديد حرفالمقاط�ع [ 39]س�هيل- الص�عب PAWsجزأ م�ن وج�د حي�ث أولي�ة ألجزاء

مقط�ع لك�ل المحي�ط خ�ط وأوج�د ألحرف، مباشرة المتص�لة الكلم�ة فص�لس�لسلة شيفرة باس�تخدام وشفرهم�ا وس�فلي، علوي لجزأي�ن وفص�لهالوص��ول حت��ى لليس��ار اليمي��ن م��ن جزء ك��ل مس��ح ث��م وم��ن فريمان،

المقط�ع، negative slopeلنقطة م�ن حرف ألول الوص�ول ت�م وبالتال�يكامن��ة حدودي��ة نقط��ة اعتباره��ا نقطتين PLBويت��م أ��ي ث��م وم��ن ،PLB

فص�ل س�هولة وميزته�ا قط�ع، كخ�ط يحدد واح�د، عمودي خ�ط عل�ى تقعانم�ن عان�ت لكنه�ا األس�اسي،� الخ�ط ع�ن مس�تقلة وأنه�ا كالنقاط، الملحقات

الفجوات وذات المتداخلة األحرف مع التعامل في .مشكلة

27

Page 28: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

الكلمات لتقطيع المنجزة األعمال أهمأحرف إلى (2)العربية هيكل- ترفيع على اعتمدت األعمال احدى

PAW وتحديد له العمودي االسقاط وأخذ ،وإيجاد لليسار اليمين من بالمسح التقطيع نقطة

من القيمة في مثلما 1التغير أعلى قيمة أليعند تفشل الطريقة وهذه بالشكل يظهر

المسقط [. 64]األفقي استخدام

وآخرون- تحدي��د 2012عام ، [22]الجراح عل��ى تقوم تقني��ة عرضواتت�م وبذل�ك حذف�ه، ث�م وم�ن األفق�ي باإلس�قاط األس�اسي الس�طرالحرفي�ن تقطي�ع التقني�ة هذه تس�تطع ل�م األحرف، انفص�ال عملي�ة

. لجزأين ر الحرف وقطعت ص، س،وآخرون ذات 2012عام ،[ 23]المص�لح نافذة تس�تخدم تقني�ة قدموا

تعرف نس�بة وحققوا التعرف، م�ع التقطي�ع لتنفي�ذ ديناميك�ي حج�مالى %.96وصلت

28

Page 29: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

الكلمات لتقطيع المنجزة األعمال أهمأحرف إلى (3)العربية

مص�طفى- التركي�ب [ 65]اس�تخدم قواع�د عل�ى مبني�ة خوارزمي�ةأ�ن عليه�ا بني�ت الت�ي األس�اسية القاعدة العرب�ي، للن�ص الهيكل�ي

ثالثي�ة وص�لة عن�د تبدأ الكلم�ة أحرف قب�ل و T-junctionمعظ�م تنته�يالتغييرات م�ع للتعام�ل أخرى قواع�د تضمي�ن وت�م التالي�ة، الوص�لةاألحرف تقطي�ع دق�ة أعط�ت التجريبي�ة النتائ�ج القاعدة، هذه ف�ي

96.5.%البح���ث- األحرف [ 67]يقدم تقطي���ع تقنيات ع���ن شامال عرضا

العربية. نف��س م��ن العمودي االس��قاط عل��ى المعتمدة الطرق تعان��ي

. سابقا المذكورة المساوئ م�ن تعان�ي فإنه�ا األس�اسي الخ�ط عل�ى اعتمدت الت�ي الطرق

ف�ي بس�يط تغي�ر أ�ي وإ�ن بموقع�ه ك�بير بشك�ل تعلقه�ا مشكل�ة. مشاكل الى تؤدي سوف كثافته أو موقعه

محاس��نها له��ا المس��تخدمة التقطي��ع تقنيات م��ن تقني��ة ك��لالالزم من أكث�ر التقطي�ع مشكل�ة م�ن وتعان�ي over ومس�اوئها

segmentationالالزم من أقل under segmentationأو

29

Page 30: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

النص صورة لتقطيع المقترحة التقنيةكلمات (1)وأحرف إلى

PROPOSAL TECHNIQUE لمرحلة العام الصندوقي المخططالتقطيع

المفصل الصندوقي التقطيعلمرحلة المخطط

30

تقطيع

أسطر أحرفكلماتصورة تقطيع

تقطيع

Page 31: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

Page Image

Image 1Image 1

Image 2

Image 3

Image 2Image 3

Analyzes to Lines

Analyzes to Words

Analyzes to Characters

Characters Image 31

يشرح عملية تقطيع صورة شكل إلى صور أحرف النص

Page 32: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

إلى النص صورة لتقطيع المقترحة التقنية(2)وأحرف كلمات

أ�و اس�تخدمنا • الغرض عل�ى تعتم�د التقطي�ع ف�ي جديدة خوارزميات( Objectالكائن الصوري) .[91]العنصر

بعضه��ا • م��ع والمتص��لة المتجاورة البكس��الت م��ن مجموع��ة الكائ��نمعي�ن باس�م عنونته�ا يمك�ن والت�ي أ�و( label) البع�ض م�ن ، مجموع�ة ه�و

ثماني ) أو رباعي بشكل والمترابطة المتجاورة .(8أو( )4الواحداتو • والكلمة السطر من كل اعتبار و تم .الحرف كائن أو غرض النقطةالبنيوي�ة ت• التشكي�ل وتواب�ع عمليات باس�تخدام التقطي�ع عمليات ت�م

Morphological Operations ]92,93[.بنيوية تم • عناصر على محددة Structure Elementsاالعتماد أشكال .لهاف�ي • بعضه�ا م�ع األحرف وص�ل أج�ل م�ن العمليات تل��ك اس�تخدمنا

لت الواحدة الس�طر شك�لالكلم�ة ف�ي بعضه�ا م�ع والكلمات واح�د كائ�نواحد كائن لتشكل التقطيع. . الواحد مرحلة docمخطط

32

Page 33: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

على الحصول خوارزمية(1)سطراال

المعالجة وثيقة صورة : الدخل• لمرحلة .خضعت المسبقة خاليا ) : الخرج• مص�فوفة األس�طر البع�د cell arrayص�ور أحادي�ة

أس�طر عدد للس�طر، ثنائي�ة ص�ورة ع�ن عبارة منه�ا عنص�ر ك�ل .) الوثيقة صورة في األسطر عدد هو المصفوفة هذه

: التالي الصندوقي بالمخطط موضحة الخطوات

 

ب: معين SEتمددأجسام لربطمع الكلمات

النقاط والهمزات

ب: مربع SEتقلصالتصاق لعدم

المنخفضة األحرففي والمرتفعة

المتجاورة األسطر

ب: خط SEتمددلربط أفقي

المتباعدة الكلماتالسطر ضمن

الواحد

الكائنات عنونةالصورة في

احداثيات ايجادفي الكائنات حدود

الصورة

صور اقتطاعفي الكائناتصور ) الصورةمن( األسطر

االصلية الصورة

صورة النص

صور األسط

ر

33

Page 34: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

على الحصول خوارزمية(2)سطراال

34

التمدد عمليتي: لتطبيق: مرحلية نتيجة يوضح شكلوالتقلص

Page 35: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

على الحصول ( 3سطر)االخوارزميةالنهائية النتيجة يوضح شكل

35

Page 36: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

كلمات إلى سطر تقطيع (1)خوارزمية .: الدخل- األسطر صورعن ) : الخرج- عبارة منها عنصر كل خاليا مصفوفة الكلمات صور

الموجودة الكلمات عدد هو المصفوفة هذه أسطر عدد ثنائية، صورة.) الصفحة في

: التالي الصندوقي بالمخطط موضحة الخطوات

36

 

ب: دائرة SEتمدداالتصال لتأمين

األحرف بينالزوايا بكافة

الكائنات عنونةالصورة في

احداثيات ايجادفي الكائنات حدود

الصورة

صور اقتطاعفي الكائناتصور ) الصورةمن( الكلمات

االصلية الصورة

صورة السط

ر

صور الكلما

ت

ب: معين SEتمددأجسام لربطمع الكلمات

والهمزات النقاط

ب: خط SEتقلصلحذف عموديعلى البكسالتالعلوية الحدود

والسفلية

نتيجة يوضح شكلمرحلة

Page 37: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

كلمات إلى سطر تقطيع (2)خوارزميةالنهائية النتيجة يوضح شكل

37

Page 38: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

الص�ندوقي بالمخط�ط الموضح�ة األربع�ة بالمراح�ل الخوارزمي�ة تم�رالتالي:

.: الدخل- الكلمة صورة) : الخرج- ع�ن عبارة منه�ا عنص�ر ك�ل خالي�ا مص�فوفة األحرف ص�ور

الموجودة األحرف عدد ه�و المص�فوفة هذه أس�طر عدد ثنائي�ة، ص�ورة.) الصفحة في

تقطيع إلى خوارزمية الكلمات(1)أحرف

38

على الحصولجسم صورةبدون الكلمة

نقاط

خطوط تحديدعلى القطعجسم صورة

الكلمة

صورة ايجادمع الكلمة

وخطوط النقاطالقطع

صورة تقطيعصور إلى الكلمة

مكان أحرفالقطع خطوط

صورة

الكلمة

صور األحرف

Page 39: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

تقطيع إلى خوارزمية الكلمات(2)أحرف

: األولى- دون المرحلة الكلمة جسم صورة على الحصول: نقاط

: الثانية- جسم المرحلة صورة على القطع خطوط تحديدالكلمة

39

لكي الفجوات ملءتحديد على تؤثر ال

الوصل منطقة

باستخدام تقلص Diamond SEمعين

األجسام لفكبالكلمة المتصلة

النقاط حذفوالهمزات

بنفس تمددإلعادة SEالعنصر

لحجمها الكلمةالسابق

صورة الكلمة بدون نقاط

صورة الكلم

ة

I1

I

الخط إيجاداألساسي باستخدام االسقاط األفقي

عرض تحديدالوصل منقطة

األحرف بينبكسل10

التي المناطق إيجادأو أصغر مجموعها

10يساوي مناطق) بكسل

الوصل(

نهايات تحديدمن الوصل مناطق

وجعلها اليسارقطع خطوط

جمع البكسالت

لكل عمودياكلمة صورة

صورة الكلمة

بخطوط قطع

وبدون نقاط

صورة الكلمة بدون نقاط I1

I2

Page 40: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

تقطيع إلى خوارزمية الكلمات(3)أحرف

: الثالثة- القطع المرحلة وخطوط النقاط مع الكلمة صورة :إيجاد

صورة XORعملية بينقطع بخطوط جسم

نقاط ) مع( I2وبدونالكلمة جسم صورة

نقاط ) مع (Iاألصلية

خطوط حذفوبقاء القطع

النقاط

صورة جمع عمليةصورة مع النقاط

الكلمة جسمقطع بخطوط

نقاط (( I2وبدون

+

40

صورة الكلمة

بخطوط قطع  ونقاط

صورة الكلمة

بخطوط قطع

وبدون نقاط I2

I3

I2

I2

I

I3

حذف خطوط القطع

Page 41: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

تقطيع إلى خوارزمية الكلمات(4)أحرف

: القطع- خطوط مكان الكلمة صورة تقطيع الرابعة المرحلة

41

الكلمة صورة تقطيع(I3 )خطوط مكان

القطع

صور  األحرف

صورة الكلمة

بخطوط قطع ونقاط

األحرف أجزاء حذفعن الناتجة الصغيرة

التقطيع

I3

عن مثالالكلمات تقطيع

Page 42: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

المقترحة التقنية محاسن أهمللتقطيع الكائ�ن - عل�ى البكس�ل ب تعتم�د م�ن ص�ورة دال وتقطي�ع تحلي�ل حي�ث الوثيق�ةف�ي ،

. الكائنات أو المناطق من عدد إلى الصورة تحويل على تعملث�م - وم�ن الس�طر عل�ى بالحص�ول بداي�ة تقوم حي�ث منهج�ي بشك�ل تعم�ل

. أحرف إلى تقطيعها يتم التي الكلمة- . للضجيج تحسسا أقل- . الحرف أو الكلمة شكل في حدوثها الممكن التشوهات مع تتعامل- . محدودة للصورة مسبقة معالجة عمليات تتطلب- . سهلة عليها والتعديل وبرمجتها تنفيذها طريقة- وقتا تس�تغرق والت�ي وطويل�ة معقدة واحص�ائية حس�ابية عمليات تتطل�ب ال

. التنفيذ وزمن المعالجة زمن تقليص وبالتالي طويال،الحس�اب - ف�ي والس�رعة بالدق�ة تتمي�ز الت�ي المورفولوجي�ة العمليات تس�تخدم

والتنفيذ.- . وسليم صحيح بشكل ومنفصلة مقتطعة أحرف وتنفيذها تجريبها أعطىومعالج��ة - والمتالمس��ة، المتداخل��ة األحرف تقطي��ع عل��ى بقدرته��ا تتمي��ز

. البنيوية النصية التعقيدات42

Page 43: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

المقترحة التقنية مساوئ أهمللتقطيع

. صحيح- بشكل السين حرف تقطيع عدم

بعض- بعد :النقاط حذف الحرف أجزاء بحذف تقوم حيثع.التقطي

43

Page 44: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

استخالص مرحلة(1)ميزاتمال أه�م • م�ن النماذج، وأص�عب تع�د عل�ى التعرف أنظم�ة مراح�ل

. عالي تعرف أداء لتحقيق العوامل أهم من وواحدةالخص����ائص • م����ن مختلف����ة وتص����نيفات مجموعات ظهرت

العربية لألحرف .[94]والمميزاتاس��تخالص • وتقنيات طرق تطوي��ر أج��ل م��ن الباحثون س��عى

دق�ة ف�ي زيادة إل�ى تؤدي وعملي�ة فعال�ة تكون المميزات، لهذه. التعرف أنظمة وسرعة

شعاع • عل�ى الحص�ول ف�ي المميزات اس�تخالص مشكل�ة تكم�ن. ممكنة دقة أكبر يعطي يمكن ما أقصر مميزات

تعقي���د • إل���ى يؤدي س���وف المميزات عدد زيادة أ���ن وجدن���ام��ن ولي��س والتدري��ب، المعالج��ة زم��ن ف�ي وزيادة العمليات

. النتائج تحسين إلى يؤدي أن الضروريومناقش���ة • باختيار المميزات قمن���ا م���ن محدودة مجموع���ة

للحرف.عل���ى • قادرة ودقيق���ة بس���يطة رياضي���ة عالقات وبتص���ميم

الم هذه وتمثيل .[95]يزاتماستخالص

44

Page 45: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

45

الجس�م - شيفرة م�ن للحرف الشكل�ي التوص�يف مميزة أوجدن�ا بداي�ة. للحرف الرئيس

ذات - لألحرف بالنسبة كافية غير المميزة هذه أن وجدنا( األشكال - - - - ( ، �ع� �م� ر و مثل المتقاربة الخارجية

: ب�� - وتختلف للحرف الرئيس الجسم شكل نفس - ) - - خ ) ح ج مثل النقاط (. موقع - ث ) ت مثل النقاط بمساحة

الحرف - ف�ي هامي�ن بقس�مين خاص�ة مميزات باختيار قمن�ا لذل�ك : بإيجاد وذلك والفجوات، النقاط وهما تمييزه المطلوب

- . ومس��احة- الفجوات عدد النقاط وموق��ع النقاط مس��احة.الفجوات

استخالص مرحلة(2)ميزاتمال

Features Extraction Stage

CharacterImage

Find Point position

Calculate holes area

Count holes

Convert to chain code

Calculate Point area

Features vector

مخطط مرحلة است.خالص المميزات

doc

Page 46: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

الخاصة المميزاتبالنقاط

للجسم- بالنسبة النقاط موقعللحرف :Point_pos الرئيس

الكائن- مركز احداثيات Y2 2إيجاد

الكائن- إحداثيات 1إيجاد ) المحور) على الحرف Yجسم ، Y1 و الجسم بداية ارتفاع Yhاحداثيات

: حالت ثالث لدينا يكون الجسم، Y1> Y2 Y1< Y2 Y1< Y2

Y1+ Yh > Y2Y1+ Yh > Y2 Y1+ Yh< Y2

الرئيس  الجسم الرئيس فوق الجسم الرئيس داخل الجسم أسفلالنقاط- Point_areaمساحة

46

points

ch_main

y1+ yh

Y1

Y

Y2

مجموع = النقاط مس�����احةمس�احة – الكائنات مس�احةم�ن األول الدلي��ل ذو الكائ��ن

. المساحات شعاع

Page 47: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

بالفجوات الخاصة المميزات

الفجوات - عددالكائنات = – عدد الفجوات 1عدد

الفجوات- مساحةالكائن = – مساحة الكائنات مساحة مجموع الفجوات مساحة

المساحات شعاع من األول الدليل ذو

47

شعاع أوجدن��ا ق��د نكون المميزات اس��تخالص مرحل��ة نهاي��ة ف��ي : التالي المميزات

 V)Ch_Features( =]ch_chain point_pos point_area holes hole_area[

للحرف • الرئيس الجسم صورة -Ch~ نفيmain.Image

الصورة • في الكائنات عنونةالصورة • في كائن كل مساحة ايجادشعاع • في ووضعها تنازليا المساحات ترتيب

عمود

2الكائن

1الكائن

Page 48: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

التصنيف مرحلة (1)والتعرف

لنظام تعد الرئيسة القرار صنع .OCRمرحلة . التقطيع عملية طبيعة على كبير بشكل تعتمد. التشابه قياس على باالعتماد التمييز عملية تتم تص��نيف طريق��ة عل��ى باالعتماد التص��نيف قرار اتخاذ يت��م

مجاور .[75] أقرب اإلقليدي�ة المس�افة حس�اب شعاع Euclidean Distanceيت�م بي�ن

نماذج جمي���ع مميزات وأشع���ة المدخ���ل الحرف مميزات. المعطيات قاعدة في المخزنة األحرف

. الحرف إليه ينتمي الذي الصنف الصغرى المسافة تحدد

48

Page 49: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

54

المعطيات قاعدة خصائص بحيث الحياة واقع من لنصوص عشوائية بصورة اختيارها تم

. النص داخل وأرقام الترقيم عالمات على تحتوي. مشكولة وغير مطبوعة النصوص. الدراسة أدوات باستخدام يدويا تمت للحاسب ادخالها عملية. مختلفة بأطوال وأحرف وكلمات أسطر على تحتوي. طبيعي الكلمة وضمن والكلمات األسطر بين التباعد عند ملونة كصور مسحها تم البيانات قاعدة صفحات جميع

كعدم dpi 300الدقة المسح وشروط االحتياطات مراعاة مع ،. واالنحراف الدوران

الكتابة 4تتضمن في استخداما الخطوط األكثر من أنواع. بصريا جيد بشكل ومميزة العربية

خط نوع المستند 3لكل تحرير نطاق ضمن مختلفة أحجام(to 14 12)النموذجي

Page 50: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

األحرف مجموع����ة األحرف (( ASMO-449 اس����تخدمنا تعرف الت����يب��� ( 36العربي��ة ( األحرف مجموع�ة ال��ى آل� آ، التركي��بين أضفن��ا حرف،

. للتعرف المعتمدة شك�ل 68اس�تخدمنا عدا األحرف حاالت أشكال وه�ي لألحرف شك�ل

) - - ( ه� غ ع باستثناء بالوسط .الحرف : م:ن األول:ى المعيطات قاعدة - 25تتأل:ف اختبار 6ص:فحة

تدريب صفحات : التدريب معطيات حجم ويكون

حرف +68 ) 9شكل من لألرقام = 9حتى 1أشكال شكل77رقم( الخطوط × 4شكل × 77 من الحجوم × 3أنواع من نموذج 1نوع

شكل = كل من .924للحرف محرف نموذج - من الثانية المعطيات قاعدة اختبار - 10تتألف 2صفحات

للتدريب صفحة : التدريب معطيات حجم ويكون

حرف +68 لألرقام + 10شكل ترقيم =12أشكال محرف 90رمزالخطوط × 4× 90 من الحجوم × 2أنواع من كل 5نوع من نموذج

.3600محرف = محرف نموذج

50

قاعدة وبناء المعطيات اختيارالمعطيات

Page 51: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

الخطأ تصنيف( 1والتقييم)

. صعبة مهمة المختلفة األنظمة بين والمقارنة التقييم مهمة كان�ت مختلف�ة تقنيات اعتمدت الت�ي األبحاث ك�ل نتيج�ة إ�ن

قاعدة اختالف بس���بب للمقارن���ة قابل���ة وغي���ر متفاوت���ةالمستخدمة .المعطيات

. الدخل جودة على كبير بشكل يعتمد النظام أداء األخطاء تص�نيف أج�ل م�ن معياري�ة اختبار مجموع�ة توج�د ال

أنظمة أداء [.21]العربية OCRوتقييم اختبار أج��ل م��ن ومقبول��ة معياري��ة معطيات قاعدة توج��د ال

وأنظمة تقنيات [.21,26,94]العربية OCRومقارنة غالبا الباحثي�ن فإ�ن واالختبار التدري�ب معطيات نف�س م�ع حت�ى

النظام، مس��توى عل��ى األداء مقارن��ة نفذوا مقارن��ة م��ا أ��يالنهائي التعرف [.106] معدل

أنظم�ة معظ�م التعرف OCRف�ي معدل Recognitionيستخدمrate (الدقة النظام (Accuracyأو أداء قياس اجل [.20,39,94]من

التعرف معدالت نس���بة كتس���تخدم لمعرف���ة مئوي���ة نس���بةاألخطاء ع����ن معلومات أ����ي تقدم وال الص����حيحة، األحرف

المرتكبة.51

Page 52: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

( والتقييم الخطأ (2تصنيفاستخدمنا األداء وتقييم الخطأ تصنيف أجل 3من

طرق:

52

 

Page 53: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

)1الجداول ) المعطيات( 2و( قاعدة على التقطيع مرحلة تطبيق نتيجة يوضحان.) وورد ) برنامج مع المقارنة الخطأ لتصنيف الثانية الطريقة وباستخدام الثانية

مرحلة نتائج(2-1الجداول) تقطيعال

(1الجدول )

53

كلمات إلى العربي النص وثيقة صورة تقطيع لناتج المئوية النسبةIالوثيقة 1 2 3 4 5 6 7 8 9 10

A 553 568 519 490 424 456 538 523 434 502

B

Arial 569 601 531 517 465 468 559 537 463 507

Simplified Arabic 565 588 524 497 436 465 552 531 445 505

Arabic Transparent 565 585 532 547 434 467 556 537 448 507

Times New Roman 566 582 531 507 475 468 558 527 461 505

X

Arial 16 33 12 27 41 12 21 14 29 5Simplified Arabic 12 20 5 7 12 9 14 8 11 3

Arabic Transparent 12 17 13 57 10 11 18 14 14 5 Times New Roman 13 14 12 17 51 12 20 4 27 3

N

Arial 2.89 5.81 2.31 5.51 12.03 2.63 3.90 2.68 6.86 1Simplified Arabic 2.17 3.52 0.96 1.43 2.83 1.97 2.60 1.53 2.53 0.60

Arabic Transparent 2.17 2.99 2.50 11.63 2.36 2.41 3.35 2.68 3.23 1

Times New Roman 2.35 2.46 2.31 3.47 12.03 2.63 3.72 0.77 6.22 0.6  M 3.89                    Tw 96.58                  

Page 54: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

الجدول (2)

A : للوثيقة األحرف عددI برنامج عن : Ms-Word . Bفي الناتجة األحرف عددالوثيقة لصورة التقطيع . Iمرحلة

X : العالقة من عليه ونحص�ل الفرق وهو المرتكب | .X=|A-BالخطأN : المرتكب� للخطأ المئوية المرتكب :N=)X*100(/A. Mالنسبة الخطأ متوسط

M=∑ N/40.Tic : احصائية مع مقارنة صحيح بشكل المقطعة لألحرف المئوية النسبة

Ms-Wordبرنامج .

أحرف إلى العربي النص وثيقة صورة تقطيع لناتج المئوية النسبةIالوثيقة 1 2 3 4 5 6 7 8 9 10

A 2888 282726432555 2266 23182810264823362609

B

Arial 2905 284726892656 2332 24702730262723992595Simplified Arabic 2875 281026932565 2284 24452711258723582576

Arabic Transparent 2916 283226612666 2415 24502720261123602593Times New Roman 2932 286927102651 2355 24512747263324062609

X

Arial 17 20 46 101 66 152 80 21 63 14Simplified Arabic 107 65 38 4 391 123 100 69 7 47

Arabic Transparent 70 43 18 111 251 126 90 37 24 16Times New Roman 44 42 67 96 89 133 63 15 70 0

N

Arial 0.59 0.71 1.74 3.95 2.91 6.56 2.85 0.79 2.70 0.54Simplified Arabic 3.58 2.26 1.44 0.16 14.67 5.31 3.56 2.61 0.30 1.80

Arabic Transparent 2.34 1.50 0.68 4.34 9.41 5.44 3.20 1.40 1.03 0.61Times New Roman 1.52 1.49 2.53 3.76 3.93 5.74 2.24 0.57 3.00 0.00

  M 2.94                    Tc 97.03                  

54

Page 55: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

التصنيف نتائج مرحلة(1)التعرف

المئوية التعرف النسبة مستندات لدقة صور على النظام تطبيق لناتجمنفصلة أحرف تحوي

Iلمستند ا 1 2 3 4 5 6 7 8 9 10

A 99.7 99.56 98.81 99.63 99.28 98.59 98.61 98.97 99.15 98.29

Z 99.1                  

األولى، المعطيات قاعدة على التطبيق نتائج يعرض التالي الجدولمقارنة ) الثالثة الطريقة باستخدام التعرف دقة حساب تم حيث

(Unicodeرموز

55

 

Page 56: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

56

التعرف نتائج التصنيف (2)مرحلةالطريقة باستخدام التعرف دقة حساب Z= 98.01% فكانت 1تم

المعطيات قاعدة على التطبيق نتائج يعرض التالي باستخدام 2الجدولالخطأ تصنيف  3طريقة المئوية تطبيق النسبة لدى التعرف نصوص لدقة تحوي وثائق صور على النظام

عربية   Iالو�ثيقة

J = الوثيقة خط Iنوع

الحجم 1 2 3 4 5 6 7 8 9 10

1 Simplified Arabic 12 98.88 97.58 97.93 98.23 98.11 97.84 97.51 98.83 97.58 97.932 Simplified Arabic 14 99.07 98.79 98.09 98.15 98.39 97.93 98.39 98.35 99 98.733 Arial 12 98.83 98.49 98.26 98.84 98.26 97.88 97.83 97.98 98.57 98.124 Arial 14 98.92 97.84 97.41 97.78 97.65 97.93 97.85 97.21 97.39 97.565 Arabic Transparent 12 98.25 98.89 98.3 97.8 97.6 98 98.78 98.53 98.8 98.116 Arabic Transparent 14 99.21 98.34 97.22 97.36 98.45 98.38 98.32 98.2 98.08 98.557 Times New Roman 12 97.86 97.38 97.75 98.39 98.03 97.75 97.86 98.38 96.75 98.618 Times New Roman 14 98.42 98.16 97.82 97.89 98.31 98.17 97.98 98.41 98.04 98.13

 

Page 57: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

كانت تطابق :100نسبة التالية% لألحرف بالنسبة . واحد- جزء من تتألف التي . النقطة- بموقع وتختلف الشكل في المتشابهة

: التالية األحرف في كانت األخطاء ) ( الحاالت- بع��ض ف��ي تظه��ر كان��ت أ الهمزة م��ع األل��ف

. الهمزة بدون . الهمزة - )( بدون الحاالت بعض في يظهر كان أل التركيب

الحاء - م��ع األحيان ببع��ض تتشاب��ه المنتص��ف ف��ي العي��نبالمنتصف.

نهاي�ة - ف�ي الحاء م�ع أحيانا يتشاب�ه الكلم�ة نهاي�ة ف�ي العي�نالكلمة.

مس�احة - تقارب بس�بب ن�برة عل�ى الهمزة م�ع تتشاب�ه التاء. والهمزة النقاط

بي�ن- تتراوح التعرف نس�بة كان�ت الحاالت هذه جمي�ع 98.28ف�ي%. 99.87و

57

النتائج 1مناقشة

Page 58: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

. التقطيع خطأ يبقى الخطأ فإن النصوص مع التعامل عند دق�ة ع�ن تختل�ف ال أ�ن يج�ب الدق�ة فإ�ن الجي�د التقطي�ع م�ع

. المعزولة األحرف التقطي�ع مرحل�ة خط�أ ه�و الكل�ي النظام خط�أ اعتبار يمك�ن

أخطاء إل��ى أس�اسا ترج��ع التص��نيف مرحل��ة اخفاقات أل��ن. التقطيع مرحلة

. السابقة التعرف أخطاء نفس تقريبا لدينا تظهر كانت أدى وعدمه��ا الهمزة وجود حي��ث ال، التركي��ب م��ع أهمه��ا

. التعرف في ومشاكل التقطيع في لمشاكل. نبرة على والهمزة التاء حرف بين التشابه ه�و التعرف نس�بة انخفاض إل�ى أدت الت�ي المشاك�ل أه�م

بع�ض تحذف التقطي�ع عن�د ألن�ه الترقي�م، عالمات م�ن النقط�ة. األحرف أجزاء حذف عند النقاط

هي - الثانية المعطيات قاعدة في النقاط عدد %. 1.2نسبةيمك�ن - والت�ي لدين�ا التعرف دق�ة عل�ى أثرت أنه�ا نالح�ظ لذل�ك

من ألكثر ترتفع .99أن الترقيم% عالمات بدون 58

النتائج 2مناقشة

Page 59: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

النتائج (1)مقارنة : المنفصلة لألحرف بالنسبةهناك- أ�ن وجدن�ا الباحثي�ن م�ن العدي�د أعمال مراجع�ة بع�د

والبح�ث عملن�ا بي�ن بع�ض [96]تشاب�ه اس�تخالص حي�ث م�ن ، . العربية األحرف صور من المميزات

العربي�ة - األحرف عل�ى المميزات باختبار الباح�ث قام حي�ثتض�م الت�ي الفارس�ية باس�تخدام 32للغ�ة م�ن 3حرف أنواع

الت��ي الخطوط ع��ن مختلف��ة وه��ي واح��د، بحج��م الخطوطاستخدمناها.

تعرف- دقة متوسط على الباحث %. 97.4حصلاس�تخدمنا- أنن�ا نج�د بحثن�ا م�ع للحروف 68بالمقارن�ة شك�ل

ب� ب� 4العربية مختلفة .3أنواع أحجام األحرف- على تعرف دقة إلى .99وصلنا % تقريبا

59

Page 60: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

النتائج (2)مقارنة أه::م م::ع بالمقارن::ة العربي::ة للنص::وص بالنس::بة

الحديثة :2012األعمالوآخرون- رشاد حققه�ا تعرف دق�ة وص��لت[ 103]أفض�ل ،97 %

. االحصائية المميزات بعض باستخداموآخرون - وص���لت ،[ 22] الجراح دق���ة % 96.1ال����ى حققوا

ال���ى باالضاف���ة االحص���ائية المميزات بع���ض باس���تخدام. التعرف دقة وتحسين الالحقة المعالجة أجل من قاموس

وطريق��ة - المميزات حي��ث م��ن لبحثن��ا األبحاث أقرب م��ععام س�هيل تعرف [39]2004التص��نيف، دق��ة حق��ق ،97 %

. 3على بحجمين الخطوط من أنواعالتجارية- التطبيقات أهم مع بالمقارنة

النص�وص عل�ى التعرف برام�ج أفض�ل م�ع مقارن�ة يل�ي فيم�اReadiris Pro 11 شرك��ة مجال .( I.R.I.S)م��ن ف��ي رائدة وه��ي

األكث�ر ال�برنامج وه�و االلكترون�ي، للشك�ل الن�ص ص�ورة تحوي�لالباحثي�ن قب�ل م�ن والمقارن�ة للدراس�ة عل�ى[ 88]اعتمادا وذل�ك ،

. عربي نص تحوي عشوائية عينة60

Page 61: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

برنامج مع النتائج READIRISمقارنةPRO 11 األصلي النص

61

Page 62: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

الناتج تطبيقنا التمييز عن

62

Page 63: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

برنامج التمييز Readiris عنPro 11

63

Page 64: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

النتائج تقييم بخط��أ تعرف دق��ة إل��ى م��ع% 2وص��لنا التعام��ل عن��دوأرقام أحرف تحتوي عربي����ة لنص����وص ص����فحات

. ترقيم وعالمات بخط�أ تعرف دق�ة ص�فحات% 1وإل�ى م�ع التعام�ل عن�د

. فقط أحرف تحتوي عربية لنصوص بخط�أ تعرف دق�ة ص�فحات% 1وإل�ى م�ع التعام�ل عن�د

. فقط منفصلة عربية أحرف تحوي وجه��ة م��ن انجازا النس��ب هذه إل��ى الوص��ول يعت��بر

نظرنا.

64

Page 65: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

68

الخالصة الحص�ول الص�عب م�ن أن�ه العملي�ة التجارب خالل م�ن وجدن�ا

الكفاء�ة م�ن عالي�ة درج�ة عل�ى ضوئ�ي مس�ح نتيج�ة عل�ىتقنيات باس��تخدام مجموعات OCRوالدق��ة م��ع العم��ل عن��د

والصحف القديمة .والمخطوطات الوثائق الحص��ول أ��ن القول يمك��ن الجودة عالي��ة للوثائ��ق بالنس��بة

برمجيات بواس���طة ضوئيا مقروء ن���ص ص���حيح OCRعل���ىويجري% 100 إلي�ه الوص�ول يرج�ى ومطل�ب هدف زال م�ا

. تحقيقه إلى السعي مختلف�ة بمجاالت من�ه لالس�تفادة الطري�ق تفت�ح البح�ث نتائ�ج

والنص�وص األحرف عل�ى التعرف تط�بيقات أهمه�ا م�ن كثيرةالعربية.

مجال ف�ي للباحثي�ن أس�اسية لبن�ة العم�ل هذا اعتبار يمك�نأج�ل م�ن األحرف عل�ى والتعرف العربي�ة للغ�ة اآللي�ة المعالج�ة

مشابهة أخرى أنظمة .تطوير

Page 66: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

69

واألعمال االقتراحاتالمستقبلية من - 1 جديد عدد .الخطوطأنواع اضافة

حج��م - 2 تحدي��د يس��تطيع بحي��ث النظام عل��ى التعدي��ل يمك��ن. تلقائيا الخط

الخطوط - 3 باس��تعمال المتعلق��ة المواص��فات واعتماد وض��عوالشبكة الحاسوب على .العربية

الحرف - 4 ترمي��ز مجال ف��ي التقيي��س لجهود الدع��م تقدي��م. العلمية المصطلحات مخازن وبناء ومعالجته العربي

الكتاب�ة -5 ف�ي العربي�ة الرس�مية الخطوط توحي�د عل�ى العم�لالعربية.

قواع��د - 6 م��ع معياري��ة خطوط مجموع��ة ألبعاد بيانات إيجاد.حرفألامواصفات وعملي�ة - 7 تحس�ين ف�ي والدالل�ي النحوي التحلي�ل م�ن االس�تفادة

المعالجة مرحلة في وذلك .الالحقةالتعرف

Page 67: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

المنشورات[91] ،خالد بكرو �، يحيى، نجار دباس، محمد ”- 2011الحميد

إلى مطبوع عربي نص وثيقة صورة لتقطيع جديدة خوارزميات ” الهندسية، العلوم سلسلة حلب جامعة بحوث مجلة ، وأحرف كلمات

العدد حلب، .101جامعة

[95 ] �،خالد بكرو يحيى، نجار دباس، محمد طريقة”- 2012الحميدمحددة مجموعة باستخدام العربية األحرف على التعرف في جديدة

” العلوم سلسلة حلب جامعة بحوث مجلة ، المميزات منالعدد( 2الهندسية) حلب، جامعة ،107.

67

Page 68: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

(1)المراجع]3[ Al-Badr, B., Mahmoud, S.A., “Survey and Bibliography of Arabic Optical Text Recognition”, Elsevier

Science, Signal Processing, Vol. 41, pp. 49-77, 1995.]4[ Khorsheed, M. S.,“Off-line Arabic character recognition-A review”, Pattern Analysis .and applications,

Springer-Verlag, Vol. 5, No. 1, pp 31–45, 2002.]5[ Govindan, V. K.,Shivaprasad, A. P., “Character Recognition, A review”, Pattern Recognition, Vol. 23,

No. 7, pp. 671–683, 1990.]6[ Srihari, S. N., Character Recognition, in Encyclopaedia of Artificial Intelligence

2nd Edition, pp. 138—150, John Wiley, 1992.]7[ Haj Hassan, F. and Hag Ali, W., Printed Arabic Text Recognition, The Arabian Journal for Science and

Engineering, Vol.16, No.4B, pp. 511-518 October 1991.]8[ AIM, Inc. What is OCR? 634 Alpha Drive ,Pittsburgh, PA 15238-2802, US.

Arabic Optical Text Recognition”, Elsevier Science, Signal Processing, Vol. 41, pp. 49-77, 1995.]9[ Amin, A., “Offline Arabic Character Recognition: The State of the Art”, Pattern Recognition, Vol. 31,

pp. 517-530, 1998.]11[ Zavorin, I. Borovikov, E. Turner, M. and Hernandez, L. “Adaptive pre-OCR cleanup of grayscale

document images,” in , vol. 6067, pp. 60670C-1–60670C-9. 2005.]12[ Attia, M., “Arabic Orthography vs. Arabic OCR; Rich Heritage Challenging A

Much Needed Technology”, Multilingual Computing & Technology magazine, USA, Dec. 2004.]20[ El-Mahallawy, M., S., M., A Large Scale HMM-Based Omni Front-Written OCR System for Cursive

Scripts, PhD thesis, Dept. of Electronics and Electrical Communications, Faculty of Engineering, Cairo University, Apr. 2008.

]21[ Husni A. Al-Muhtaseb, S. Mahmoud, and Rami S. Qahwaji, “Recognition of Off-line printed Arabic text Using Hidden Markov Models”, Signal Processing, Volume 88, Issue 12, pp. 2902-2912. December 2010.

68

Page 69: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

(2)المراجع]22[ Aljarrah, I., Al-Khaleel, O., Mhaidat, KH,. “Automated System for Arabic Optical Character

Recognition with Lookup Dictionary”, JOURNAL OF EMERGING TECHNOLOGIES IN WEB INTELLIGENCE, VOL. 4, NO. 4, November 2012.

]23[ Mesleh1, A., Sharadqh,, A., Al-Azzeh, J., Abu-Zaher, M. “An Optical Character Recognition”, Contemporary Engineering Sciences, Vol. 5no. 11, 521 – 529, , 2012.

]25[ Sarfraz M, Nawaz SN, Al-Khuraidly A.,“ Offline Arabic text recognition system“. The Proceedings of IEEE International Conference on Geometric Modeling and Graphics-GMAG’2003.

]26[ Amor, N. B. and Ben Amara, N. E. “Multifont Arabic Characters Recognition Using Hough Transform and HMM/ANN Classification,” JOURNAL OF MULTIMEDIA, vol. 1, pp. 50-54, 2006.

]29[ Zeki, A.M., “The Segmentation Problem in Arabic Character Recognition The State Of The Art”, 1st International Conference on Information and Communication Technologies )ICICT(,Aug 2005.

]34[ AL-Shatnawi, A., A L-Zawaideh, F., “Offline Arabic Text Recognition-An Overview”, World of Computer Science and Information Technology Journal ,, Vol. 1, No. 5, 184-192, 2011.

]39[ Suhail, A. S. “ Off-Line Typewritten Arabic Character Recognition”, M .SC. thesis, Cairo Univ., 2004.]54[ Amin, A and Mari, J.F., Machine Recognition and correction of Printed Arabic Text, IEEE Transaction

on system Man And Cybernetics,Vol.19, No.5, pp.1300-1306, October 1989.]55[ Agrawal, M, Doermann, D., Re-targetable ocr with intelligent character segmentation. The Eighth

IAPR International Workshop on Document Analysis Systems, pp183-190,2008.]57[ Abdelazim, H. Y. “text Recognition: theory and implementation” , Ph.D. thesis, Cairo Univ., 1989. ]64[ Jain, A. K., W., R. P. Duin, and Mao, J., “Statistical pattern recognition: A review”, IEEE Trans. Pattern

Analysis and Machine Intelligence, Vol. 22, pp. 4–38, January 2000.]65[ Mostafa G. Mostafa. “An Adaptive Algorithm for the Automatic Segmentation of Printed Arabic Text”,

17th International Conference for computer. King Abdul Aziz University, April 2004.69

Page 70: تطوير نظام للتعرف الضوئي على الخط العربي د. خالد بكرو  system Development for Optical  recognition Arabic font   Dr. Khaled Bakro

(3)المراجع]67[ Zeki, M. Zakaria and C. Liong, Segmentation of Arabic Characters: A Comprehensive Survey,

International Journal of Technology Diffusion, 2)2011(, 48-82.]75[ Blue, J. L.,Candela, G. T., Grother, P. J., Chellappa, R., and Wilson, C. L.,“Evaluation of Pattern

Classifiers for Fingerprint and OCR Applications” Pattern Recognition, Vol. 27, No. 4, 1994.]88[ Batawi, Yusof; Abulnaja, Osama., “Accuracy Evaluation of Arabic Optical Character Recognition

Voting Technique: Experimental Study”, International Journal of Electrical & Computer Sciences IJECS-IJENS Vol: 12 No: 01. February 2012.

]92[ Gonzalez, R., Woods, R., Eddins, S., Digital Image Processing Using MATLAB, 2nd ed., Prentice Hall, 2003.

]93[ Image Processing Toolbox User’s Guide; The MathWorks, Inc; 3 Apple Hill Drive, Natick, MA 01760-2098, 2011.

]94[ Pervez Ahmad and Yousef Al-Ohali, “Arabic Character Recognition: Progress and Challenges”, J. King Soud Univ., Vol. 12,Comp.Info.Sci.,pp85-116)A.H. 1420/2000(.

]96[ Izakian, H., Monadjemi, S. A., Tork Ladani, B. ”Multi-Font Farsi/Arabic Isolated Character Recognition Using Chain Codes”. World Academy of Science, Engineering and Technology, 43, 2008.

]103[ Tapas Kanungo, Gregory A. Marton, Osama Bulbul. “OmniPage vs. Sakhr: Paired Model Evaluation of Two Arabic OCR Products”, Part of the S&T/SPIE Conference on Document Recognition and Retrieval V$ . San Jose. California 109 SPIE Vol. 3651. January 1999.

]106[ Liu, C-L., Hiromichi Fujisawa. “ Classification and Learning for Character recognition: Comparison of Methods and Remaining Problems”, Pattern Recognition, 34)3(: 601-615, 2008.

]107[ Rashad, M.; Amin, K.; Hadhoud, M.; Elkilani, W. “Arabic character recognition using statistical and geometric moment features”, Conference on Electronics Communications and Computers, Japan-Egypt, 2012.

70