ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج...

160
أ

Upload: others

Post on 24-Mar-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌أ

Page 2: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ب

‌ دانشکده مهندسی برق و رباتیک

گروه الکترونیک پایان نامه کارشناسی ارشد

تعبیهنوشته فارسی با استفاده از روش دست جستجوی کلمات در یک تصویر

هامشخصه

بهاره اسدی

:راهنمااستاد

فرداحمدی دکتر علیرضا

:استاد مشاور

مجید ایرانپور مبارکه

4931 بهمن

Page 3: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ت

:تقدیم به

چشمه های جوشان محبت

مهر و عطوفت الهیجلوه های

یمدگ لبخندهای پر مهر زن

و مادر عزيزم پدر

.‎در تمام مراحل زندگی، به من راه و رسم درست زيستن را آموختند كه

Page 4: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ث

:تقدیر و تشکر

دکترر آقای جناب استاد گرامی از را خویش قدردانی و سپاس مراتب دانم می لازم خود بر

نقرش نامره پایران این گیری شکل در مستمر و دقیق راهنمایی با که فرد احمدی علیرضا

-هر پیشبرد در بسزایی تأثیر ایشان هایکمک و نظرات شک بی. نمایم ابراز داشتند، مهمی

از استاد گرامری جنراب آقرای دکترر مجیرد .است داشته نامه پایان این سریعتر و بهتر چه

.اند کمرا تشرکر و قردردانی را دارم ایرانپور که زحمت مشاوره این رساله را بر عهده گرفته

همچنین از دوستان عزیزم که در ثمر رسیدن این پایان نامه یرار و همرراهم بودنرد تقردیر و

.کنمتشکر می

Page 5: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ج

دانشیکره‌‌‌الکم ونیی ‌/دانشجوی‌دوره‌کارشناسی ‌ارشیر‌رشیمه‌دسنرسی ‌ ی ‌‌‌‌‌‌بهاره اسدیاینجانب‌

جستجوی کلمات در یک ‌نادیه‌‌ی‌پایانشاه ود‌نویسنره‌صنعم دسنرس ‌ ‌و‌ر اتی ‌دانشگاه

ی ‌دکمی ‌‌راهنماتحت‌‌هامشخصه تعبیهنوشته فارسی با استفاده از روش دست تصویر

‌.شوم‌‌ ددمعسر‌‌ف داحمریعلی ضا‌

تحقیقات‌در‌این‌پایان‌ناده‌توسط‌اینجانب‌انجام‌شره‌است‌و‌از‌صحت‌و‌اصالت‌ خوردار‌است.

نمایج‌پژوهشسای‌دحققان‌دیگ ‌ ه‌د جع‌دورد‌اسمفاده‌اسمناد‌شره‌استدر‌اسمفاده‌از‌.

دررک‌یا‌‌ ‌نوع ‌دریافت‌هیچ ‌ ای ‌دیگ ی ‌ف د ‌یا ‌خود ‌توسط ‌تاکنون ‌ناده ‌پایان ‌در ‌دنررج دطالب

.ادمیازی‌در‌هیچ‌جا‌ارائه‌نشره‌است

نام‌شاه ود‌د ‌ اشر‌و‌دقالات‌دسم‌صنعم ‌کلیه‌حقو ‌دعنوی‌این‌اث ‌دمعلق‌ ه‌دانشگاه‌‌ »‌خ ج‌ ا

‌ ‌دانشگاه ‌صنعم ‌شاه ود »‌ ‌یا ‌ of Technologhy ‌Shahrood University»و ‌چاپ‌« ه

.خواهر‌رسیر

حقو ‌دعنوی‌تمام‌اف ادی‌که‌در‌ ه‌دست‌آدرن‌نمایح‌اصل ‌پایان‌ناده‌تأثی گذار‌ وده‌انر‌در‌دقالات‌

.دسمخ ج‌از‌پایان‌ناده‌رعایت‌د ‌گ دد

اسمفاده‌شره‌(‌یا‌ افمسای‌آنسا‌)‌ن‌ناده‌،‌در‌دواردی‌که‌از‌دوجود‌زنره‌در‌کلیه‌د احل‌انجام‌این‌پایا

.است‌ضوا ط‌و‌اصول‌اخلاق ‌رعایت‌شره‌است

در‌کلیه‌د احل‌انجام‌این‌پایان‌ناده،‌در‌دواردی‌که‌ ه‌حوزه‌اطلاعات‌شخص ‌اف اد‌دسم س ‌یافمه‌یا‌

.اسمفاده‌شره‌است‌اصل‌رازداری‌،‌ضوا ط‌و‌اصول‌اخلا ‌انسان ‌رعایت‌شره‌است‌

:تاریخ

: امضای دانشجو

مالکیت نتایج و حق نشر

دقالات‌دسمخ ج،‌کماب،‌ ناده‌های‌رایانه‌ای،‌ن م‌افزار‌ها‌و‌تجسیزات‌)کلیه‌حقو ‌دعنوی‌این‌اث ‌و‌دحصولات‌آن‌

در‌تولیرات‌علم ‌این‌دطلب‌ ایر‌ ه‌نحو‌دقمض ‌.‌شاه ود‌د ‌ اشرصنعم ‌دمعلق‌ ه‌دانشگاه‌(‌ساخمه‌شره‌است‌

.د وطه‌ذک ‌شود

رون‌ذک ‌د جع‌دجاز‌نم ‌ اشر‌یان‌نادهاسمفاده‌از‌اطلاعات‌و‌نمایج‌دوجود‌در‌پا .

د نامهـتعه

Article I.

Article II.

Article III.

Article IV.

Article V.

Article VI.

Article VII. ‌‌

Page 6: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ح

چکیده

در‌ایین‌رو ‌‌.‌اطلاعات‌دمن ‌در‌اسناد‌تصوی ی‌اسیت‌‌روش ‌ ای‌اسمخ اج‌ی‌کلیری،‌کلمه‌جسمجوی

آن‌کلمه‌در‌داخیل‌‌ های‌و‌دکان‌نمونهجسمجو‌شره‌ ،ی‌پ سش ‌دورد‌نظ ‌کار ‌در‌اسناد‌تصوی ی‌کلمه

یشم ‌تحقیقات‌انجام‌شره‌در‌این‌زدینه‌ ‌روی‌دمون‌ز ان‌لاتیین‌ارائیه‌شیره‌‌‌‌ .شود‌اسناد‌دشخص‌د

سیار‌کم‌د ‌ اشر‌که‌اکثی ‌ایین‌تحقیقیات‌هیم‌ ی ‌‌‌‌‌‌‌جام‌شره‌در‌ز ان‌فارس ‌و‌ع ان‌تحقیقات.‌است

نوشیمه‌‌ ای‌جسمجوی‌کلمات‌در‌تصیوی ‌دسیت‌‌‌الگوریمم ‌پایان‌نادهاین‌در‌‌.روی‌اسناد‌چاپ ‌هسمنر

‌.استدو‌د حله‌‌که‌شادل‌دهیمد فارس ‌ارائه‌

دیمن‌‌ره‌سپس‌تصیاوی ‌کلمیات‌داخیل‌‌‌‌ریگ ‌جرا‌شکخطوط‌دمن‌از‌یلازم‌است‌ا مرا‌‌ی‌اولدر‌د حله‌

ی‌‌های‌دمصل‌دوجود‌در‌دمن‌اسمخ اج‌شره‌سیپس‌دولفیه‌‌‌دولفه ای‌انجام‌این‌د حله‌‌.شونر‌‌اسمخ اج

تمام‌‌،ت ین‌همسایه‌ ا‌اعمال‌رو ‌نزدی ‌سپس.‌شود‌دمصل‌که‌ش وع‌کننره‌ه ‌خط‌است‌دشخص‌د

.‌آینیر‌ق ار‌دارنر‌ رست‌د ی ه‌و‌ ه‌همان‌ت تیب ‌که‌در‌دمن‌های‌دمصل‌ه ‌خط‌ صورت‌ی ‌زنج‌دولفه

های‌دمصلش‌ ه‌طور‌دسیمقل‌از‌دیا ق ‌خطیوط‌‌‌‌‌توان‌ه ‌خط‌را‌ ا‌دولفه‌د ‌در‌نمیجه‌ عر‌از‌این‌د حله

ی‌ عیری‌ یا‌در‌نظی ‌‌‌‌‌در‌د حلیه‌.‌ اشیر‌‌نمیجه‌این‌د حله‌جراسازی‌خطوط‌از‌یکیریگ ‌دی ‌‌.‌نمایش‌داد

تا‌هفت‌دولفیه‌دمصیل‌تشیکیل‌‌‌‌‌ی وف‌اضافه‌و‌کلمات‌فارس ‌از‌ت کیب‌گ فمن‌این‌قانون‌که‌اکث ‌ح

‌کلمات‌اسیمخ اج‌شیره،‌‌ ی ای‌هی ‌کیرام‌از‌ایین‌تصیاوی ‌‌‌‌‌.‌شیود‌‌اسمخ اج‌کلمات‌دمن‌انجام‌د ‌،انر‌شره

‌.‌شوددخمصات‌دکان ‌آنسا‌در‌دمن‌نیز‌ذخی ه‌د

‌ییافمن‌هرف‌ی‌دوم‌در‌د حلهکه‌ایجاد‌شره‌‌،ای‌از‌کلمات‌کانریردجموعه‌ی‌اولد حله‌انجامدر‌نمیجه‌

کلمیات‌‌.‌ اشیر‌و‌دشیخص‌کی دن‌دکیان‌آنسیا‌در‌دیمن‌دی ‌‌‌‌‌‌های‌کلمات‌پ سش ‌در‌این‌دجموعه‌نمونه

ی‌ی‌کلمیه‌ ی ای‌جسیمجو‌‌‌د حلیه‌‌ایین‌‌در.‌هسیمنر‌ی‌دمنی ‌‌پ سش ‌ورودی‌ ه‌صورت‌تصوی ‌و‌رشمه

ایین‌نیوع‌‌‌‌گیی ی‌کیار‌ یه‌‌اسمفاده‌شره‌است‌کیه‌‌ ا‌در‌نظ ‌گ فمن‌الفبای‌فارس ‌‌ها،‌از‌دشخصهپ سش

‌.شباهت‌ ین‌کلمات‌دسمقل‌از‌شیوه‌نگار ‌حفظ‌شود‌شود‌که اعث‌د ‌دشخصه

Page 7: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌خ

‌ ی ای‌‌فارسی ‌‌نوشیمه‌سینر‌دسیت‌‌‌011ای‌شیادل‌‌‌پایگاه‌داده‌و‌کلمه‌پ سش ‌55ای‌شادل‌از‌دجموعه

و‌‌%55/75تصیوی ‌‌ ای‌پ سش‌ یا‌‌ف اخوان ‌ ه‌ت تیب‌و‌دقت‌‌دموسط.‌شره‌استرو ‌اسمفاده‌زیا ‌را

‌‌. اشر‌د ‌%24/70و‌%‌40/01ی‌دمن ‌‌و‌ ای‌پ سش‌ ا‌رشمه54/01‌%

کلمات کلیدی

‌جراسیازی‌خطیوط‌‌‌ چسیب،‌‌تعبیه‌،دشخصه،‌ی‌فارس نوشمهاسناد‌دست،‌ی‌کلیریجسمجوی‌کلمه‌

دمصلهای‌دولفه‌،مند

Page 8: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌د

لیست مقالات مستخرج

-ای‌از‌دولفیه‌خط‌دنبالیه‌جراسازی‌خطوط‌دمن‌و‌اسمخ اج‌ ون‌"م،‌.پورع،‌ای ان.ف د ب،‌احمری.اسری

،‌تسی ان،‌‌"،‌نسمین‌کنف انس‌داشین‌ ینای ‌و‌پ داز ‌تصوی ‌ایی ان‌"نوشمه‌فارس های‌دمصل‌در‌دست

0925.‌

نوشمه‌فارس ‌ ا‌اسیمفاده‌از‌‌جسمجوی‌کلمات‌در‌ی ‌تصوی ‌دست"م،‌.ع،‌ای انپور.ف د ب،‌احمری.اسری

در‌دسنرسی ‌کیادپیوت ‌و‌‌‌‌های‌کیار دی‌الملل ‌پژوهش،‌سودین‌کنف انس‌ ین"هادشخصهرو ‌تعبیه‌

‌.0925،‌تس ان،‌"‌فناوری‌اطلاعات

Page 9: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ذ

بفهرست مطال

ج ................................................................................................................. .ها فهرست شکل

ظ ................................................................................................................... .فهرست جداو

4 ................................................................................................................... مقدمه: فصل او

2 ................................................................................................. امهن انیپا اهداف 4-4

5 ........................................................... یدیکل یکلمه یجستجو یهاروش یبنددسته 0-4

5 ................................................................................................. نامهانیپا ساختار 4-9

7............................................................................... های انجام شدهمروری بر فعالیت: فصل دوم

8 .............................................................................................................. مقدمه 2-4

8 ......................................................................... جستجو روش براساس یبندمیتقس 2-2

2 ............................................................................ ی نرقطعه‌ ‌ دبمن‌یروشسا 4-4-0

05 ............................................................................... ی نرقطعه‌ رون‌یروشسا 4-4-4

43 ....................................................................... صیتشخ روش براساس یبندمیتقس 2-9

40 ........................................................................ الگو‌قیتطب‌ ‌ دبمن‌یهارو 4-9-0

47 ........................................................................... ی یادگی‌ ‌ دبمن‌یهارو 4-9-4

94 ............................................................... یپرسش یکلمه نوع براساس یبندمیتقس 2-1

97 ..................................................................................................... مباحث نظری: فصل سوم

SIFT ................................................................................. 98 یهایژگیو استخراج 9-4

Page 10: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ر

92 ...................................................................................... یریکل‌نقاط‌افمنی 9-0-0

50 .................................................................. اصل‌نقطه‌ه ‌ دکان‌دوقعیت‌تعیین 9-0-4

54 ................................................................................... یریکل‌نقاط‌فگ یتوص 9-0-9

19 ...................................................................................................... شریف بردار 9-2

59 ............................................................................ یتصاو‌ش یف‌ دار‌اسمخ اج 9-4-0

Almazan .................................................................................. 11 یشنهادیپ روش 9-9

55 .................................................................... هادشخصه‌یهیپا‌ ‌کلمات‌شینما 9-9-0

50 ................................................................................ ش یف‌ی دارها‌اسمخ اج 9-9-4

54 ................................................................................. دشخصه‌یفضا‌آدوز 9-9-9

55 ...................................... دشم ک‌ی دار‌یفضا‌در‌ها چسب‌و‌هادشخصه‌رتبه‌هیتعب 9-9-5

50 ....................................................................................... ازشناس‌اتیعمل 9-9-5

52 .......................................................................... ازشناس‌ید حله‌جینما 9-9-5-0

14 ................................................................. الگوریتم پیشنهادی و نتایج ارزیابی آن: فصل چهارم

12 ............................................................................................................ مقدمه 1-4

12 .......................................................................................... او یشنهادیپ روش 1-2

55 ............................................................................................. ا یارز‌رو 5-4-0

70 ......................................... ریکانر‌یدجموعه‌در‌کلمات‌کاهش‌ی ا‌یشنسادیپ‌رو 5-4-4

74 .......................................................................کلمات‌یجسمجو‌ید حله‌جینما 5-4-9

09 .............................................................................. ممیالگور‌یاج ا‌زدان 5-4-9-0

89 .................................... ( یقیتطب یبندهیناح با GMM آموزش) دوم یشنهادیپ روش 1-9

05 ................................................... قیتطب‌ی نرهیناح‌ ا‌‌‌GMMآدوز ‌رو ‌جینما 5-9-0

Page 11: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ز

02 ..... های متصلای از مولفهالگوریتم پیشنهادی برای جداسازی خطوط و استخراج دنباله: فصل پنجم

39............................................................................................................. مقدمه 5-4

34 .................................................................. خط هر یاصل متصل یها مولفه استخراج 5-2

31 ....................................................... خط هر یاصل متصل یها مولفه یرو پردازشپس 5-9

491 ...................................................................................................... یگذاریجا 5-1

015........................................................رونره‌ الا‌دمصل‌ی‌دولفه‌یگذاریجا‌یها‌رو 5-5-0

010 .................................................... رونره‌نییپا‌دمصل‌ی‌دولفه‌یگذاریجا‌یها‌رو 5-5-4

001 ......................................................خط‌یرو‌دمصل‌ی‌دولفه‌یگذاریجا‌یها‌رو 5-5-9

449 .............................................................................................. خطوط یجداساز 5-5

441 ................................................................... متن کلمات ریتصو خط برون استخراج 5-1

429 ....................................................................................... یشنهادیپ روش جینتا 5-7

090 .................................................................................. گیری و پیشنهاداتنتیجه: فصل ششم

497 ................................................................................................................... مراجع

Page 12: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌س

هافهرست شکل

0 .............................................................. نهیزد‌نیا‌در‌دوجود‌یروشسا‌ی نردسمه:‌0-‌‌4شکل

c[05] ................................................ 00 ‌و‌u، h، gدر‌آب‌دخازن‌و‌‌gدر‌حف ه‌وجود:‌4-‌‌4شکل

00 ................................................................... [05] ح وف‌شکل‌یکرگذار‌رو :‌9-‌‌4شکل

04 ........................................................... [05]‌قیتحق‌یساخمار‌یها ژگیو‌شینما:‌5-‌‌4شکل

09 ............................................................................. [07]‌ ع ‌ح وف‌یکرها:‌5-‌‌4شکل

05 ............................................................................. [00]‌قیتحق‌رو ‌د احل:‌5-‌‌4شکل

05 .................................................... [00]‌آنسا‌یساخمار‌یها ژگیو‌و‌ فارس‌کلمات:‌7-‌‌4شکل

07 ........................................................................ [02]‌ ع ‌کلمات‌ی نرقطعه‌:0-‌‌4شکل

07 .......................... [02]‌ ع ‌در‌ی نرقطعه‌از‌دسمقل‌و‌ دبمن‌رو ‌دو‌در‌دقت‌سهیدقا:‌2-‌‌4شکل

00 ..................................................................................[44]‌قیتحق‌د احل‌:01-‌‌4شکل

02 ............................................................. [49]‌در‌شره‌ دع ف‌رو ‌ کل‌یشما:‌00-‌‌4شکل

44 ................................ [91]‌نظ ‌دورد‌ پ سش‌یکلمه‌یازا‌ ه‌دمن‌در‌‌PWsصیتشخ:‌04-‌‌4شکل

49 .......................... [91]‌دمن‌در‌ پ سش‌یکلمه‌ینمونه‌افمنی‌و‌گ یگری‌ ا‌‌PWsادغام:‌09-‌‌4شکل

45 ............................... [90]‌‌قیتحق‌در‌یاشبکه‌ ژگیو‌اسمخ اج‌و‌ انطباق‌ی نرهیناح:‌05-‌‌4شکل

‌BOVW‌[92]............................................. 40رو ‌ ا‌یهنر‌ی یتصو‌اسناد‌ ا ی از:‌05-‌‌4شکل

42 .................................. [51]‌لغزان‌یپنج ه‌توسط‌شره‌جادیا‌ریکانر‌کلمات‌دجموعه:‌05-‌‌4شکل

91 ........................... ]50[‌قیتحق‌ی روشنا‌سطح‌و‌جسمرار‌انیگ اد‌یها ژگیو‌اسمخ اج:‌07-‌‌4شکل

90 ........................................................................... [54]‌قیتحق‌رو ‌د احل:‌00-‌‌4شکل

95 ............................................................................ [55]‌سممیس‌ کل‌یشما:‌02-‌‌4شکل

‌DOG‌[51] ................................................................................ 50ه م‌جادیا:‌0-‌‌9شکل

DOG[51] ......................................................... 50 ه م‌در‌هااکسم دم‌یآشکارساز:‌4-‌‌9شکل

54 ................................................................... [51]دار‌جست‌انیگ اد‌سموگ امیه:‌9-‌‌9شکل

57 ........................................................ 9و‌‌0،‌4سطوح‌در‌ح وف‌ ه د‌سموگ امیه:‌5-‌‌9شکل

51 ....................................میدسمق‌یکلمه‌ یتصو‌یرو‌ ‌ثا ت‌یانرازه‌ ا‌هیناح‌‌04جادیا:‌5-‌‌9شکل

Page 13: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

54 ................................................. خط‌‌SVM ا‌اُم‌iیدشخصه‌درل‌آدوز ‌نریف آ‌:5-‌‌9شکل

59 ............................................................................................. رو ‌د احل:‌0-‌‌5شکل

55 .................................................... کشور‌یکلمه‌ ا‌دمناظ ‌ قیتطب‌و‌حیصح‌ یتصو:‌4-‌‌5شکل

50 .......................................... "صنعت"‌یکلمه‌ی ا‌سممیس‌توسط‌شره‌آشکار‌کلمات:‌9-‌‌5شکل

70 ......................................... .باشنرید‌دموسط‌دقت‌نی الات ‌یدارا‌که‌ پ سش‌کلمات‌:5-‌‌5شکل

70 .......................................... .باشنرید‌دموسط‌دقت‌نی الات ‌یدارا‌که‌ پ سش‌کلمات:5-‌‌5شکل

72 ............................ دمن‌در‌دوجود‌ پ سش‌یکلمه‌ ا‌دمناظ ‌یهانمونه‌تمام‌یآشکارساز‌:5-‌‌5شکل

01 ......................................... .هسمنر‌دموسط‌دقت‌نینم ییپا‌یدارا‌که‌ پ سش‌کلمات:‌7-‌‌5شکل

01 ......... .است‌شره‌ ی‌رتبه‌در‌آنسا‌صیتشخ‌عرم‌دوجب‌کلمات‌از‌ عض‌شرن‌نوشمه‌ناخوانا: 0-‌‌5شکل

00 ............ .است‌شره‌آنسا‌صیتشخ‌ ه‌دوفق‌ممیالگور‌که‌ پ سش‌یکلمه‌ ا‌دمناظ ‌یهانمونه: 2-‌‌5شکل

00 .......... .است‌شره‌آنسا‌صیتشخ‌ ه‌دوفق‌ممیالگور‌که‌ پ سش‌یکلمه‌ ا‌دمناظ ‌یهانمونه: 01-‌‌5شکل

04 .................................................................... دمن‌در‌اساس‌یکلمه‌یجسمجو:00-‌‌5شکل

04 ................................................................... دمن‌در‌اقمصاد‌یکلمه‌یجسمجو:04-‌‌5شکل

04 .................................................................. دمن‌در‌تی یدر‌یکلمه‌یجسمجو:09-‌‌5شکل

05 ............................................................ کلاس‌ ی‌ ه‌د وط‌ یتصاو(‌ب‌و‌الف:‌)05-‌‌5شکل

05 ............................................. ]55 [کلاس‌ ی‌یهانمونه‌ی ا‌ قیتطب‌ی نرهیناح:‌05-‌‌5شکل

07 ..................................................................................... رو ‌دو‌یسهیدقا:05-‌‌5شکل

24 .................................................. .شود‌ د‌ هیذخ‌دمصل‌ی‌دولفه‌ه ‌ی ا‌که‌ نقاط:‌0-‌‌5شکل

24 .............................. دمن‌در‌دوجود‌دمصل‌یها‌دولفه‌تمام‌یها‌کسلیپ‌تعراد‌سموگ امیه:4-‌‌5شکل

25 ........................................................... دمن‌داخل‌دمصل‌یها‌دولفه‌تمام‌اسمخ اج:9-‌‌5شکل

25 ........................................... (‌‌‌‌‌‌‌‌ آ ‌رنگ)اول‌خط‌ اصل‌دمصل‌یها‌دولفه‌ هیذخ:5-‌‌5شکل

25 .......................................... آنسا‌ی شناسا‌بیت ت‌ ه‌اول‌خط‌دمصل‌یدولفسسا‌شینما:5-‌‌5شکل

‌شی ط‌‌در‌نکی دن‌‌صیر ‌‌لیدل‌ ه‌اول‌خط‌دمصل‌یها‌دولفه‌ستیل‌در‌ هوش‌ی‌‌نقطه‌نگ فمن‌ق ار‌:5-‌‌5شکل

25 ..................................................................................................................... ی

27 ... آن‌از‌گذرنره‌خط‌و‌آنسا‌شادل‌دحرب‌ رنه‌افمنی‌و‌اول‌خط‌ اصل‌دمصل‌یها‌دولفه‌ هیذخ:‌7-‌‌5شکل

Page 14: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ص

27 . .انر‌افمهی‌اخمصاص‌سوم‌خط‌ ه‌اشمباه‌ ه‌و‌هسمنر‌چسارم‌خط‌ ه‌د وط‌که‌ دمصل‌دولفه‌دو‌:0-‌‌5شکل

27 .............. سوم‌خط‌دعادله‌ ا‌دمصل‌یها‌دولفه‌ی‌فاصله‌گ فمن‌نظ ‌در‌ ا‌ الا‌یخطا‌حیتصح:‌2-‌‌5شکل

20 ..................................... (ق دز‌خط)‌دو‌درجه‌تا ع‌ صورت‌ششم‌خط‌گ فمن‌نظ ‌در‌:01-‌‌5شکل

22 .................................................................. ششم‌خط‌یجراساز‌در‌خطا‌جادیا:00-‌‌5شکل

22 ...................................... (ق دز‌خط)اول‌درجه‌تا ع‌ صورت‌ششم‌خط‌گ فمن‌نظ ‌در:04-‌‌5شکل

22 ....................................................... پنجم‌خط‌یجراساز‌د حله‌در‌خطا‌حیتصح:09-‌‌5شکل

011 ..................................................... ششم‌خط‌یجراساز‌د حله‌در‌خطا‌حیتصح:05-‌‌5شکل

010 ............................................. پ داز پس‌از‌ عر‌اول‌خط‌ی نسا‌دمصل‌یها‌دولفه:05-‌‌5شکل

014 (پ داز پس‌ی‌د حله)آنسا‌ی‌جراگانه‌ هیذخ‌و‌دمن‌کل‌از‌دمصل‌یها‌دولفه‌از‌ عض‌حذف:05-‌‌5شکل

014 ............................................ پ داز پس‌از‌ عر‌دوم‌خط‌ی نسا‌دمصل‌یها‌دولفه:‌07-‌‌5شکل

014 (پ داز پس‌ی‌د حله)آنسا‌ی‌جراگانه‌ هیذخ‌و‌دمن‌کل‌از‌دمصل‌یها‌دولفه‌از‌ عض‌حذف:00-‌‌5شکل

019 ........................................... پ داز ‌پس‌از‌ عر‌سوم‌خط‌ی نسا‌دمصل‌یها‌دولفه:02-‌‌5شکل

019 (پ داز پس‌ی‌د حله)آنسا‌ی‌جراگانه‌ هیذخ‌و‌دمن‌کل‌از‌دمصل‌یها‌دولفه‌از‌ عض‌حذف:41-‌‌5شکل

019 ......................................... پ داز پس‌از‌ عر‌چسارم‌خط‌ی نسا‌‌دمصل‌یها‌دولفه:40-‌‌5شکل

015 (پ داز پس‌ی‌د حله)آنسا‌ی‌جراگانه‌ هیذخ‌و‌دمن‌کل‌از‌دمصل‌یها‌دولفه‌از‌ عض‌حذف:44-‌‌5شکل

015 ............................................................................ خطوط‌دعادلات‌شینما:‌49-‌‌5شکل

015 .............................................................. خطوط‌دعادلات‌افکنش‌ افق‌نمودار:45-‌‌5شکل

017 .............................................."گذا‌" اصل‌ی رنه‌از‌قبل‌"گ"س کش‌یگذاریجا:45-‌‌5شکل

017 ............................................... "گ ‌" اصل‌ی رنه‌از‌قبل‌"گ"س کش‌یگذاریجا:45-‌‌5شکل

010 ........................................................."سا" اصل‌ی رنه‌از‌قبل‌نقطه‌یگذاریجا:47-‌‌5شکل

001 ............ .شود د‌یگذاریجا‌آنسا‌نی ‌و‌نراشمه‌اشم اک‌"الف"‌دمصل‌یدولفه‌دو‌ ا‌نقطه‌:40-‌‌5شکل

001 .................................................................... "نچه"‌از‌قبل‌نقطه‌یگذاریجا‌:42-‌‌5شکل

000 .................. .شود د‌یگذاریجا‌"و"‌و‌"ر"‌دمصل‌یدولفه‌دو‌نی ‌"الف"دمصل‌یدولفه:91-‌‌5شکل

000 ....................................... .شود د‌یگذاریجا‌"د"‌و‌"الف"‌نی ‌"ر"دمصل‌یدولفه:90-‌‌5شکل

004 ......................................شود د‌یگذاریجا‌"سعا"‌و‌"ر"‌نی ‌"الف"دمصل‌یدولفه:94-‌‌5شکل

Page 15: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ض

004 ..........................................شود د‌یگذاریجا‌آن‌نقاط‌از‌ عر‌"شت"‌ اصل‌ی رنه:99-‌‌5شکل

004 ......................................... . دیگ د‌ق ار‌"در"‌و‌"الف"‌از‌قبل‌"ر"‌دمصل‌یدولفه:95-‌‌5شکل

009 ................................................. اول‌خط‌از‌دانره‌جا‌دمصل‌یها‌دولفه‌یگذاریجا:95-‌‌5شکل

009 ....................................................................... دمن‌خطوط‌یجراساز‌جهینم:95-‌‌5شکل

005 ...................................................................... دمن‌خطوط‌یجراساز‌جهینم:‌97-‌‌5شکل

005 .................................................. دمصل‌یهادولفه‌ی دوتا‌بیت ک‌گ فمن‌نظ ‌در:90-‌‌5شکل

005................... اصل‌ یتصو‌ اانرازه‌‌هم‌ی یتصو‌در‌دمصل‌یهادولفه‌بیت ک‌ک دن‌آشکار:92-‌‌5شکل

007 .............................................. کلمه‌ه ‌ یتصو‌ دکان‌تیدوقع‌آوردن‌ رست‌رو :51-‌‌5شکل

000 ........................................... شکل‌دمصل‌یهادولفه‌از‌ی تا‌دو‌یبسایت ک‌اسمخ اج:50-‌‌5شکل

000 ................................................. دمصل‌یهادولفه‌از‌ی تا‌سه‌یبسایت ک‌اسمخ اج:54-‌‌5شکل

002 .............................................. دمصل‌یهادولفه‌از‌ی تا‌چسار‌یبسایت ک‌اسمخ اج:‌59-‌‌5شکل

002 ................................................ دمصل‌یهادولفه‌از‌ی تا‌پنچ‌یبسایت ک‌اسمخ اج:‌55-‌‌5شکل

044 ........................................هیپا‌خط‌یدعادله‌ ا‌"مینیبید"‌ینقطه‌یفاصله‌شینما:‌55-‌‌5شکل

044 ..................................... نی یز‌خط‌یدعادله‌ ا‌"مینیبید"‌ینقطه‌یفاصله‌شینما:‌55-‌‌5شکل

049 .................................................................... نقطه‌دمصل‌یدولفه‌یگذاریجا:‌57-‌‌5شکل

049 ................................................................. س کش‌دمصل‌یدولفه‌یگذاریجا:‌50-‌‌5شکل

049 ......... س کش‌و‌نقطه‌یگذاریجا‌از‌ عر‌هم‌س ‌پشت‌دمصل‌یهادولفه‌گ فمن‌ق ار‌بیت ت:‌52-‌‌5شکل

045 ............................................. یشنسادیپ‌رو ‌ی ی کارگ‌ ا‌دمن‌خطوط‌یجراساز:51-‌‌5شکل

045 ............................................ یشنسادیپ‌رو ‌ی ی کارگ‌ ا‌دمن‌خطوط‌یجراساز:‌50-‌‌5شکل

045 ............................................ یشنسادیپ‌رو ‌ی ی کارگ‌ ا‌دمن‌خطوط‌یجراساز:‌54-‌‌5شکل

045............................................ یشنسادیپ‌رو ‌ی ی کارگ‌‌ ا‌دمن‌خطوط‌یجراساز:‌59-‌‌5شکل

045................. انر‌شره‌نوشمه‌کج‌یحر‌تا‌که‌دمن‌خطوط‌دورد‌در‌یشنسادیپ‌رو ‌عملک د:‌55-‌‌5شکل

047 ................................................. انر‌شره‌جرا‌ درسم‌ ه‌که‌ الا‌دمن‌اول‌خط‌سه:‌55-‌‌5شکل

047 ............................................... انر‌شره‌جرا‌ درسم‌ ه‌که‌ الا‌دمن‌آخ ‌خط‌چسار:55-‌‌5شکل

047 ....... .انر‌شره‌‌نوشمه‌هم‌از‌کم‌فاصله‌ ا‌که‌ دمن‌خطوط‌دورد‌در‌یشنسادیپ‌رو ‌عملک د:‌57-‌‌5شکل

Page 16: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ط

040 ................................................ .انر‌شره‌جرا‌ درسم‌ ه‌که‌ الا‌دمن‌اول‌خط‌سه:‌50-‌‌5شکل

040 .................................................انر‌شره‌جرا‌ درسم‌ ه‌که‌ الا‌دمن‌آخ ‌خط‌سه:‌52-‌‌5شکل

‌دمصیل‌‌یهیا‌دولفه‌نی ‌اتصال‌لیدل‌ ه‌خط‌ه ‌ ه‌د وط‌دمصل‌یها‌دولفه‌صیتشخ‌ی توانا‌عرم:‌51-‌‌5شکل

042 ............................................................................................................... خطوط

‌کیم‌‌ی‌فاصیله‌‌و‌ادیی‌ز‌ کجی‌‌لیی‌دل‌ یه‌‌خط‌ه ‌ ه‌د وط‌دمصل‌یها‌دولفه‌صیتشخ‌ی توانا‌عرم:‌50-‌‌5شکل

042 ........................................................................................................ هم‌از‌خطوط

Page 17: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

‌ظ

هاو فهرست جد

51 ............................................................................. ازشناس‌ید حله‌حینما:‌0-‌‌9جرول

71 ......................................................................................... ارهایدع‌فیتع :‌0-‌‌5جرول

79 ................................................................... ‌7تا‌‌0نی ‌ ف اوان‌ ا‌کلمات‌تعراد:‌4-‌‌5جرول

‌حالیت‌‌ی ی ا‌‌دمفیاوت‌‌یهیا‌آسیمانه‌‌در‌ دمنی‌‌سینر‌‌‌011یرو‌ ‌رو ‌ی کارا‌یارهایدع‌دموسط‌:9-‌‌5جرول

75 ............................................................................................... دمن‌و‌ یتصو‌ ا‌پ سش

‌ یا‌‌پ سیش‌‌حالیت‌‌ی ی ا‌‌دمفیاوت‌‌یهاآسمانه‌در‌ دمن‌سنر‌‌011یرو‌ ‌رو ‌ی کارا‌یارهایدع‌:5-‌‌5جرول

75 .......................................................................................................... دمن‌و‌ یتصو

75 ........................................... (W'=1142)‌ دل‌ پ سش‌یکلمه‌ی ا‌ارهایدع‌تعراد:‌5-‌‌5جرول

77 .......................................... (W'=1868)‌ی ا‌ پ سش‌یکلمه‌ی ا‌ارهایدع‌تعراد:‌5-‌‌5جرول

77 ......................................... (W'=1652)‌ریتول‌ پ سش‌یکلمه‌ی ا‌ارهایدع‌تعراد‌:7-‌‌5جرول

05 ............... اول‌یهاآسمانه‌پنج‌در‌ دمن‌سنر‌‌011یرو‌ ‌رو ‌ی کارا‌یارهایدع‌دموسط‌:0-‌‌5جرول

05 .......................... دمن‌در‌ پ سش‌یکلمه‌یجسمجو‌حالت‌ی ا‌رو ‌دو‌نی ‌یسهیدقا:2-‌‌5جرول

05 .................................................... ازشناس‌حالت‌ی ا‌رو ‌دو‌نی ‌یسهیدقا: 01-‌‌5جرول

05 .............................. ثا ت‌و‌ قیتطب‌ی نرهیناح‌رو ‌دو‌در‌کلمات‌از‌ عض‌سهیدقا‌ :00-‌‌5جرول

045 ............................................................... الا‌عادل‌دو‌توسط‌خطا‌جادیا‌زانید:0-‌‌5جرول

Page 18: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا
Page 19: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

0

0 ‌

:فصل او

مقدمه

Page 20: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

4

نامهاهداف پایان 4-4

شود‌و‌اد وزه‌حجم‌ سیاری‌از‌این‌نیوع‌داده‌‌دمن‌همیشه‌یک ‌از‌دنا ع‌اطلاعات ‌دسم‌دحسوب‌د

ه‌روزانی‌ ا‌پیشی فت‌فنیاوری‌دیجیمیال،‌‌‌‌‌.شودهای‌دیجیمال،‌کاغذ،‌تصاوی ‌و‌ویرئو‌یافت‌د در‌کما خانه

.‌شیونر‌‌و‌ یه‌عنیوان‌سینر‌تصیوی ی‌ذخیی ه‌دی ‌‌‌‌‌‌‌انیر‌ ه‌صورت‌اسکن‌شره‌درآدرهکماب‌‌و‌رهزاران‌سن

-تکنیی ‌‌.کنیر‌‌ذخی ه‌و‌انمقال‌اسناد‌تصوی ی‌را‌ ه‌طور‌کارادر‌ایجاد‌د ‌،تولیر‌تکنولوژی‌دررن‌ادکان

ای‌اسمخ اج‌و‌در‌دسم س‌قی ار‌دادن‌اطلاعیات‌دمنی ‌دیورد‌‌‌‌‌0اسناد‌تصوی ی‌تحلیلهای‌تشخیص‌و‌

ی ای‌‌دو‌رهیافت‌اصل ‌ ای‌دشخص‌ک دن‌دمن‌دورد‌نظ ‌در‌اسیناد‌تصیوی ی‌‌‌‌.گی نرق ار‌د ‌اسمفاده

‌یجسیمجو‌هیای‌‌رو و‌‌4[0](OCR)هیا‌‌نویسیه‌‌نوری‌های‌تشخیصرو ‌: ازیا ‌اطلاعات‌وجود‌دارد

‌‌9کلمه‌کلیری

یه‌دمیون‌قا یل‌‌‌‌را‌آنسیا‌‌‌اسیناد‌تصیوی ی‌پ داخمیه‌و‌‌‌دمون‌دوجود‌در‌ ه‌ ازشناس ‌‌‌OCRافزارن م

زدینیه‌‌خوب‌ یا‌پیس‌‌ساده‌های‌‌دورد‌فونت‌در‌این‌رو .‌کنرتبریل‌د ‌جسمجو‌و‌وی ایش‌توسط‌رایانه

دیورد‌اسیناد‌‌‌‌درییا‌‌ یا‌کیاهش‌کیفییت‌اسیناد‌‌‌‌‌‌رو ارای ‌ایین‌‌کی‌ادیا‌‌عملک د‌قا ل‌قبیول ‌دارد‌‌تمیز‌

ای‌که‌دارای‌تعراد‌زییادی‌‌پایگاه‌دادهدورد‌این‌رو ‌در‌همچنین‌‌.یا ر‌کاهش‌د ه‌شرت‌نویس‌‌دست

‌.[4]‌ اشر ‌د زدانروش ‌است‌‌سنر‌تصوی ی

را‌ رون‌تبریل‌کل‌تصیوی ‌‌‌دمن‌انر‌که‌اطلاعات‌های‌ ازیا ‌ وده‌ نا این،‌دحققین‌ ه‌دنبال‌رو ‌

ه‌دشیخص‌‌های ‌که‌قادر‌ ه‌ ازیا ‌تصاوی ‌حیاوی‌یی ‌واژ‌‌‌از‌این‌رو‌رو .‌کنرجسمجو‌د سنر‌ ه‌دمن‌

ا میرا‌‌‌کلمیات‌‌جسمجو.‌انر‌دورد‌توجه‌ق ار‌گ فمه اشنر‌یا‌ مواننر‌لغات‌را‌در‌ی ‌تصوی ‌تشخیص‌دهنر‌

عیرها‌ایین‌تع ییف‌توسیط‌چنیرین‌‌‌‌‌‌‌.[9]‌در‌زدینه‌پ داز ‌گفمار‌پیشنساد‌شره‌استJones ‌ی وسیله

رهیافت‌دوقعیت‌کلمه‌انمخاب‌‌این‌.شرنویس‌ کار‌گ فمه‌‌گذاری‌اسناد‌چاپ ‌و‌دستدحقق‌ ای‌انریس

1

Document Image Analysis and Recognition (DIAR) 2

Optical Character Recognition (OCR) 3

Keyword Spotting

Page 21: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

9

‌یکلمیه‌‌یجسیمجو‌سیسمم‌‌،کنر‌ ه‌عبارت‌دیگ د ‌تصوی ی‌دشخصدر‌ی ‌سنر‌‌را‌شره‌توسط‌کار

درحالیکه‌توجس ‌ ه‌کلمات‌نیاد تبط‌‌کنر‌کار ‌را‌در‌سنر‌تصوی ی‌جسمجو‌د کلمه‌دوردنظ ‌کلیری،‌

‌.نرارد

ر‌نی‌تواناطلاعات‌دفیر‌و‌دسم‌کیه‌نمی ‌‌شود‌سبب‌د ‌اسناد‌تصوی یذخی ه‌رو ‌و‌از‌این‌اسمفاده‌

‌داننر‌گ افی ،‌تصاوی ‌و‌ویژگیسای‌وا سیمه‌ یه‌نگیار ‌‌‌تشخیص‌داده‌شونر‌ OCR طور‌دناسب ‌توسط

‌.[5] رنشو حفظ‌آرای ،‌داننر‌فونت‌و‌صفحه

ی‌ ه‌طیور‌دثیال‌در‌نظی ‌گی فمن‌کلمیه‌‌‌‌‌‌؛ اشر‌اسناد‌تاریخ ‌تصوی ی‌د این‌رو ‌در‌ی ‌کار د‌

کنر‌یا‌یی ‌ادکیان‌جالیب‌‌‌‌‌کم ‌د دوجود‌در‌سنر‌ها‌‌و‌عنوان‌دکان‌تصاوی ه‌شناسای ‌،‌‌Figپ سش

هیای‌‌درون‌نادیه‌‌ یه‌دعنیای‌شیکایت،‌‌‌‌Complainی‌‌های‌کلمهی‌نمونه‌دشخص‌ک دن‌دکان‌همهدیگ ‌

ها‌‌انر‌که‌کماباعلام‌ک ده‌4و‌یاهو‌0ذک ‌دیگ ‌اینکه‌گوگل‌‌نکمه‌قا ل.‌است‌ش کتارسال‌شره‌ ای‌ی ‌

کلمیه‌ا یزار‌‌‌‌یدر‌ایین‌زدینیه‌جسیمجو‌‌‌.‌[5] دهنیر‌دی ‌را‌در‌دوتورهای‌جسمجویشان‌در‌دسم س‌ق ار‌

.ارزشمنری‌ ای‌جسمجوی‌کار ان‌روی‌دحموای‌این‌کمب‌خواهر‌ ود

و‌تعیرادی‌از‌‌‌تحقیقات‌انجام‌شره‌در‌این‌زدینه‌ ‌روی‌دمون‌ز ان‌لاتین‌ارائیه‌شیره‌اسیت‌‌‌ یشم ‌

انجیام‌شیره‌در‌ز یان‌فارسی ‌و‌‌‌‌‌تحقیقیات‌‌‌. اشنرد ای‌ک هو های‌دیگ ی‌دثل‌چین ‌ز ان‌در‌دوردآنسا‌

ا‌توجه‌ یه‌اهمییت‌‌‌ ه‌همین‌دلیل‌.‌هم‌ ‌روی‌اسناد‌چاپ ‌هسمنر‌ساآن یشم ‌که‌‌استکم‌‌ سیارع ‌

نشیره‌اسیت،‌نییاز‌‌‌‌ ‌توجس ‌در‌ز ان‌فارس ‌انجام‌‌های‌صورت‌گ فمه‌کار‌قا لدسئله‌و‌اینکه‌طبق‌ رس

‌.شود ه‌انجام‌تحقیق‌در‌این‌زدینه‌احساس‌د

1www.google.com

2 www.yahoo.com

Page 22: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

5

کلیدی یکلمه های جستجویبندی روشدسته 4-2

ر؛‌نشیو‌‌ی‌پ سش ‌ ه‌دو‌دسمه‌تقسیم‌دی ‌‌کلیری‌ ‌دبنای‌نوع‌کلمه‌یکلمه‌جسمجوی‌های‌رو

که‌در‌این‌دورد‌ ه‌آن‌پ سش‌ ا‌رشمه‌ییا‌پ سیش‌‌‌‌کلمه‌دورد‌پ سش‌دمکن‌است‌ی ‌رشمه‌دمن‌ اشر

شود،‌همچنین‌دمکن‌است‌ی ‌تصوی ‌ اشر‌که‌در‌این‌حالت‌ ه‌آن‌پ سش‌ یا‌‌‌گفمه‌د ‌(QBT)0 ا‌دمن

ای‌دبمنی ‌‌هی‌‌جسمجو‌ ه‌رو تشخیص‌کلمه‌کلیری‌ ‌دبنای‌‌هایرو .‌شود‌گفمه‌د (QBE)‌4دثال

سنر‌دورد‌جسمجو‌در‌سیطح‌خیط‌‌‌‌در‌حالت‌اول‌.شونر‌ نری‌تقسیم‌د ‌ نری‌و‌دسمقل‌از‌قطعه‌ ‌قطعه

‌.‌گی دد نری‌کل‌سنر‌دورد‌جسمجو‌ق ار‌ رون‌قطعه‌در‌حالت‌دوم‌شره‌و نری‌یا‌کلمه‌قطعه

و‌دبمنی ‌ ی ‌ییادگی ی‌‌‌‌‌9دو‌رهیافت‌کل ‌تطبیق‌قالیب‌‌در‌این‌زدینه‌ ‌دبنای‌ نری‌دیگ ی‌دسمه

در‌رو ‌تطبیق‌پیکسل‌ یه‌پیکسیل‌‌‌‌.توانر‌پیکسل‌ ه‌پیکسل‌یا‌دبمن ‌ ‌ویژگ ‌ اشرتطبیق‌د ‌.است

-دحاسیبه‌دی ‌‌تصوی ‌کلمه‌دورد‌پ سش‌و‌تصاوی ‌کلمات‌داخل‌اسیناد‌‌های‌دمناظ ‌‌فاصله‌ ین‌پیکسل

ای‌ ی ای‌‌ صیورت‌گسیم ده‌‌‌[7] و‌اقلیرس ‌[5] دینکوسک ‌داننر‌فاصله‌ لوک‌شس یدعیار‌فاصله‌.‌شود

هیا‌‌‌در‌رو ‌تطبیق‌دبمن ‌ ‌ویژگ ‌تعراد‌ثیا م ‌از‌ویژگی ‌‌‌.این‌دنظور‌دورد‌اسمفاده‌ق ار‌گ فمه‌است

دارهای‌آنسا‌تعیین‌اسمخ اج‌شره‌و‌ صورت‌ی ‌ دار‌ارائه‌شره‌است‌و‌شباهت‌ ین‌تصاوی ‌ ا‌دقایسه‌

‌ CORR و‌SC‌‌[0]‌،SLH ‌[2]، DTW [01‌,00]های‌دورد‌اسیمفاده‌در‌ایین‌رو ‌‌‌‌الگوریمم.‌گ ددد

زیادی‌وجود‌دارنر‌که‌در‌ ازییا ‌اسیناد‌تصیوی ی‌و‌‌‌‌های‌ساخماری‌و‌آداری‌‌ویژگ ‌. اشر‌د ‌[04‌,09]

،‌5هیای‌افکینش‌‌‌ها‌شادل‌پ وفاییل‌‌این‌ویژگ .‌انرگ فمهکلمه‌دورد‌اسمفاده‌ق ار‌‌جسمجوی‌های‌سیسمم

‌1 Query by text(QBT)‌

‌2 Query by example(QBE)‌

‌3 Template matching‌

‌4 Projection profile‌

‌‌

Page 23: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

5

هیا،‌‌‌،‌دمیان‌9طول‌ ه‌عی ض‌،‌ارتفاع،‌ع ض،‌نسبت‌4زدینهجوه ‌ ه‌پس‌گذر،‌0پ وفایل‌ الا‌و‌پایین‌کلمه

،‌تقعی ،‌‌5هیا‌‌حفی ه‌،‌5های‌دودوی ‌ اساس‌گ ادییان‌‌و‌فوریه،‌ویژگ ‌دیانگین،‌واریانس،‌تبریلات‌دوج

‌‌.[05]‌ اشنر‌و‌غی ه‌د ‌5رونره الارونره‌و‌پایین

.‌ن‌ز یان‌اسیت‌‌آویژه‌ ا‌در‌نظ ‌خیواص‌ خصیوص‌‌‌‌‌کلمات‌ ای‌ی ‌ز ان‌جسمجویهای‌‌ارائه‌رو

.‌ اشینر‌‌کلمه‌د ‌جسمجویهای‌دمفاوت ‌در‌‌دمون‌دمفاوت‌دارای‌خواص‌دمفاوت‌و‌ نا این‌دارای‌رو

نسیا‌در‌دقایسیه‌ یا‌‌‌‌آروی‌ ی ‌‌کلمه‌‌جسمجویهای‌‌ح وف‌فارس ‌دارای‌خواص ‌هسمنر‌که‌اعمال‌رو

‌:های‌ز ان‌فارس ‌شادل‌دوارد‌زی ‌است‌این‌ویژگ ‌.ت ‌است‌ح وف‌انگلیس ‌دشکل

نوشمه‌و‌تایپ در‌اسناد‌دست‌پیوسمه‌نوشمه‌شرن‌کلمات‌فارس .0

تشکیل‌شرن‌کلمات‌از‌زی ‌کلمات‌ ه‌جای‌ح وف .4

ساخمه‌شرن‌تعراد‌زیادی‌از‌ح وف‌ ا‌ یشم ‌از‌ی ‌جزء .9

گی ی‌ح وف‌درون‌ی ‌کلمهق ارظاه ‌وا سمه‌ ه‌دحل‌ .5

.گذاری‌علائم‌نشانهکش‌یا‌آکلاد‌و‌ ها‌دثل‌سحضور‌ یش‌از‌انرازه‌تعراد‌نقاط،‌دکمل .5

نامهساختار پایان 4-9

فصل‌سیوم‌ یه‌‌‌در‌.‌ی‌جسمجوی‌کلمات‌د ور‌شره‌استدر‌فصل‌دوم‌کارهای‌انجام‌شره‌در‌زدینه

در‌فصیل‌چسیارم‌الگیوریمم‌پیشینسادی‌ ی ای‌‌‌‌‌‌.‌شیود‌پ داخمه‌دی ‌‌در‌رو ‌پیشنسادیتئوری‌دورد‌نیاز‌

5 Holes‌1 Upper/lower word profile‌

6 Ascenders and Descenders‌2 Background to ink transition‌

‌ 3 Aspect ratio‌

‌4 Gradient based binary features (GSC)‌

Page 24: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

5

در‌فصیل‌پینجم‌‌‌.‌ی‌فارس ‌و‌نمایج‌ارزیا ‌آن‌ یان‌شیره‌اسیت‌‌نوشمهی‌کلمات‌در‌دمون‌دستجسمجو

هیای‌دمصیل‌در‌دمیون‌‌‌‌ای‌از‌دولفیه‌رو ‌پیشنسادی‌جراسازی‌خطوط‌و‌اسیمخ اج‌ ی ون‌خیط‌دنبالیه‌‌‌‌

گیی ی‌و‌ارائیه‌پیشینسادات‌‌‌‌شم‌ یه‌نمیجیه‌‌فصل‌ش.‌ی‌فارس ‌و‌نمایج‌ارزیا ‌آن‌ارائه‌شره‌استپیوسمه

‌.اخمصاص‌دارد

Page 25: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

7

4

:فصل دوم

شده انجام هایفعالیت بر مروری

Page 26: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

0

مقدمه 2-4

هیای‌‌نوشمه‌در‌ز انی‌جسمجوی‌کلمات‌در‌دمون‌دستشره‌در‌زدینهدر‌این‌فصل‌تحقیقات‌انجام‌

اسیناد‌‌ا میرا‌‌:‌کنردشم ک‌را‌دنبال‌د ‌الگویی ‌ها‌در‌این‌زدینه‌رو یشم ‌.‌شونردخملف‌ رس ‌د

کنیر‌و‌‌دی ‌‌دطی ح‌شونر،‌سپس‌کار ‌یی ‌پ سیش‌را‌‌‌گذاری‌د شاخصخط‌ذخی ه‌و‌در‌ی ‌فاز‌ ون

طور‌کلی ‌سیسیمم‌تشیخیص‌کلمیه‌کلییری‌‌‌‌‌‌.‌کنراسناد‌ذخی ه‌شره‌ارزیا ‌د ‌سیسمم‌شباهمش‌را‌ ا

.‌درحالیکه‌توجس ‌ ه‌کلمیات‌نیاد تبط‌نیرارد‌‌‌کنر‌کلمه‌دوردنظ ‌کار ‌را‌در‌سنر‌تصوی ی‌جسمجو‌د

ا‌توجه‌ ه‌تنوع‌کارهای‌.‌دهرنسبت‌ ه‌پ سش‌کار ‌ارائه‌د پاسخ‌دثبت‌یا‌دنف ‌ی ‌‌ چنین‌سیسمم

‌. نیری‌کی د‌‌توان‌از‌چنر‌دیرگاه‌تقسیمهای‌دوجود‌در‌جسمجو‌کلمه‌را‌د ‌شره‌روی‌اسناد،‌رو ‌انجام

رسی ‌قی ار‌‌‌‌شره‌درگذشیمه‌دیورد‌‌‌‌انجام‌تحقیقاتگ فمه،‌ نری‌صورت‌در‌این‌فصل‌ ا‌توجه‌ ه‌تقسیم

.نشان‌داده‌شره‌است‌0-‌4شکل‌ها‌دوجود‌در‌ نری‌رو دسمه‌.گی دد

‌‌‌‌‌‌‌‌

های‌دوجود‌در‌این‌زدینه نری‌رو دسمه:‌0-‌4شکل‌

بندی براساس روش جستجوتقسیم 2-2

شره‌دمکن‌است‌سنر‌دورد‌جسیمجو‌را‌در‌سیطح‌‌‌‌های‌دوجود‌ارائه‌‌جسمجو‌کلمات‌رو ‌زدینهدر‌

انواع‌دسمه‌ نری‌‌‌روشسای‌ارائه‌شره

‌کلمه‌پ سش ‌نوع

‌‌‌تصوی ی

‌دمن

‌رو ‌جسمجو

از‌قطعه‌‌دسمقل‌ نری

‌ ‌قطعه‌ نری‌دبمن

‌خط

‌کلمه

رو ‌تشخیص

دبمن ‌ ‌یادگی ی

دبمن ‌ ‌تطبیق‌الگو

Page 27: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

2

کیه‌‌‌‌در‌صیورت ‌.‌ نری‌کل‌سنر‌را‌دورد‌جسمجو‌ق ار‌دهنر نری‌کننر‌یا‌ رون‌قطعهخط‌یا‌کلمه‌قطعه

نری‌کلمه‌وجود‌داشمه‌ اشر،‌ا مرا‌ ایر‌خطوط‌و‌سپس‌کلمیات‌از‌سینر‌جیرا‌شیود،‌کیه‌‌‌‌‌‌نیاز‌ ه‌قطعه

شونر‌که‌ از‌هم‌دشیکل‌خطیای‌ناشی ‌از‌‌‌‌در‌نوع‌دیگ ‌فقط‌خطوط‌اسمخ اج‌د .‌طای ‌استخ‌عمل‌پ

شیود‌و‌از‌‌ نری‌انجیام‌نمی ‌‌در‌آخ ین‌دورد‌هیچ‌عمل‌قطعه.‌آن‌وجود‌دارد‌ول ‌از‌نوع‌قبل ‌کمم ‌است

های ‌چیون‌پنجی ه‌لغیزان‌وجیود‌دارد‌‌‌‌‌‌کنر‌ادا‌چون‌نیاز‌ ه‌ کار‌ دن‌رو وز‌این‌خطا‌پیشگی ی‌د

‌.ای‌را‌نیاز‌خواهر‌داشتداز ‌پ هزینهپ

بندیهای مبتنی بر قطعهروش 2-2-4

نری‌ کار‌رفمه‌ ای‌اسیمخ اج‌کی دن‌‌‌قطعهرو ‌،‌اتکلم‌جسمجویهای‌دسم‌در‌رو ‌عادلی ‌

رهیافیت‌‌در‌‌.توانر‌در‌سطح‌دحل ‌ییا‌س اسی ی‌انجیام‌شیود‌‌‌‌ نری‌د قطعه.‌عناص ‌دمن ‌از‌اسناد‌است

‌،کاراکم هاوی اتصی‌‌هیا‌در‌ایین‌رو ‌‌.اسیت‌‌0کاراکم اس‌کرگذاری‌شکل‌اغلب‌ اسکارهای‌اولیه‌دحل ‌

‌هیا‌این‌رو دحرودیت‌اصل ‌.‌شونر ا‌دجموعه‌کرهای‌از‌پیش‌تع یف‌شره‌تفسی ‌د و‌‌شرهاسمخ اج‌

صورت‌شکسیمه‌‌‌کاراکم ه‌این‌دلیل‌که‌اگ ‌ی ‌یا‌چنر‌‌.است‌کاراکم نری‌حساسیت‌ ه‌خطای‌قطعه

‌.دارای‌چسبنرگ ‌ اشنر‌کرگذاری‌آنسا‌ ا‌اشمباه‌هم اه‌خواهر‌ ود‌هاکاراکم نوشمه‌شره‌ اشنر‌و‌یا‌

نری‌هی ‌کلمیه‌‌‌جای‌قطعه‌ارائه‌شر‌که‌ ه‌4شمای‌کرگذاری‌شکل‌کلمه‌،این‌دشکل ای‌غلبه‌ ‌

-های‌آن‌ یرون‌قطعیه‌‌نظ ‌گ فمه‌شره‌و‌ویژگ ‌،‌تصوی ‌کلمه‌ عنوان‌ی ‌جزء‌واحر‌درشکاراکم های ه‌

ها‌ اساس‌کر‌کی دن‌شیکل‌کلمیه‌اسیت‌کیه‌هی ‌‌‌‌‌‌‌‌این‌رو ‌ ه‌عبارت‌دیگ .‌ نری‌اسمخ اج‌شره‌است

در‌ یشم ‌دیوارد‌دجموعیه‌‌‌.‌شودکر‌د ‌کاراکم هاهای‌وا سمه‌ ه‌تصوی ‌کلمه‌ صورت‌ی ‌س ی‌از‌نشانه

-سیاده‌‌ز ان‌د جع‌دارد‌و‌این‌کارِ‌تشخیص‌را‌کاراکم ی ‌انرازه‌کوچکم ی‌نسبت‌ ه‌دجموعه‌‌9هانشانه

1 Character Shape Coding(CSC)

2 Word Shape Coding (WSC)

3 Symbol Set

Page 28: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

01

ولی ‌‌‌. نری‌ساده‌پ سش‌و‌عرم‌نیاز‌ ه‌فاز‌آدیوز ‌اسیت‌‌ها‌ف دولدزیت‌اصل ‌این‌رهیافت.‌کنرت ‌د

این‌دجموعه‌کرها،‌‌.شکننره‌هسمنرپایین‌‌نسبت‌ ه‌تصاوی ‌ ا‌کیفیتوا سمه‌ ه‌ز ان‌هسمنر‌و‌‌ س حال

ها،‌رونرهها،‌ الانقاط،‌حف هی‌دمصل،‌تعراد‌دولفه.‌کننرساخمار‌کل ‌و‌توپولوژی‌ه ‌کلمه‌را‌توصیف‌د

‌.های‌ساخماری‌هسمنرویژگ ‌این‌های ‌ازدثال....ها‌و‌رونرهپایین

تلا ‌ک ده‌تا‌دوقعیت‌کلمیات‌کلییری‌در‌تصیاوی ‌‌‌‌‌کاراکم ا‌رو ‌کرگذاری‌شکل‌‌[05]‌تحقیق

‌0هیای‌دمصیل‌‌ا مرا‌خطوط‌و‌کلمات‌ ا‌آنالیز‌دولفه.‌ضبط‌شره‌ وسیله‌دور ین‌دیجیمال‌را‌دشخص‌کنر

یه‌همیین‌‌‌‌. اشینر‌‌نیاز‌دی ‌‌کاراکم یز‌شکل‌نالآهای‌عمودی‌و‌افق ‌دمن‌ ای‌‌جست.‌شونراسمخ اج‌د

های‌افق ‌دمن‌ ا‌اسمفاده‌از‌خطوط‌‌و‌جست‌ lو‌‌iح وفاده‌از‌ی‌عمودی‌دمن‌ ا‌اسمف‌ها‌جستا مرا‌علت‌

،‌دخیزن‌‌‌کاراکم هیا‌‌حف هثا ت‌ویژگ ‌تصاوی ‌کلمه‌ ا‌اسمفاده‌از‌سه‌.‌شونر‌تعیین‌د ‌Xو‌خطوط‌دبنا‌

-نشان‌داده‌شیره‌‌4-‌4شکل‌ها‌در‌این‌ویژگ .‌رنشود ‌کررونره‌و‌پایین‌رونره الا‌کاراکم هایو‌‌4هاآب

سپس‌هی ‌‌.‌کننر‌د ‌کرگذاریعری‌ 5‌ُرا‌ ا‌ی ‌س ی‌ارقام‌‌کاراکم ه ‌تصوی ‌‌،این‌سه‌ویژگ ‌ثا ت.‌انر

اولین‌عنص ‌ایین‌‌.‌شود‌د ‌کرگذاری‌ن،آدمناظ ‌ ا‌‌کاراکم کلمه‌ ا‌کنار‌هم‌ق ارگ فمن‌کر‌شکل‌‌تصوی

عنصی های‌دوم‌تیا‌پینجم‌دخیازن‌آب‌‌‌‌‌.‌کنیر‌دورد‌ رس ‌را‌ثبت‌دی ‌‌کاراکم ها‌درون‌تعراد‌گودال‌،کر

رونیره‌را‌ یا‌‌‌و‌پیایین‌‌رونیره‌کنر‌و‌آخ ین‌عنص ‌اطلاعات‌ یالا‌،‌راست،‌ الا‌و‌پایین‌را‌ثبت‌د چپ‌سمت

ییه‌صییورت‌‌‌theی‌‌ل‌کلمییه ییه‌عنییوان‌دثییا‌.‌کنییر ییه‌ت تیییب‌دشییخص‌دیی ‌‌1و‌‌-0‌،0اخمصییاص‌

کیر‌‌‌از‌010111و110110،111100ی‌‌‌شود‌کیه‌سیه‌زیی ‌دنبالیه‌‌‌‌‌کر‌د ‌110110111100010111

لاتین‌که‌توسیط‌ایین‌‌‌‌کاراکم هایکر‌‌9-‌4شکل‌در‌.‌انر‌ ه‌ت تیب‌تولیر‌شره‌eو ‌t، hکاراکم ک دن‌سه‌

‌.انر‌دشخص‌استگذاری‌شرهرو ‌کر

‌نسایت‌ ‌کر‌شکل‌کلمات‌داخل‌اسناد‌دورد‌‌ ی‌پ سش‌دیزان‌دشا ست‌ ین‌کر‌شکل‌کلمهدر و

1 Connected Components‌ 2 Water reservoirs

Page 29: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

00

.‌شود‌دحاسبه‌د آنسا‌ ین‌‌‌0از‌فاصله‌همینگدورد‌نظ ،‌ ا‌اسمفاده‌‌ ی‌پ سش‌ رس ،‌هم‌طول‌ ا‌کلمه

‌ ‌در ‌دقت‌رو این ‌و ‌ف اخوان ‌ت تیب‌دموسط ‌‌10/52و %‌7/75 ه %‌ ‌دقرار ‌ یشم ین ‌و در‌‌F1است

.‌ اشر‌د ‌%20/72 ‌ ا ‌ ا ،‌2/1ی‌سمانهآ

c[05] و‌u، h، gو‌دخازن‌آب‌در‌‌gوجود‌حف ه‌در‌:‌4-‌4شکل‌

‌[05] رو ‌کرگذاری‌شکل‌ح وف:‌9-‌4شکل‌

‌ ‌ز‌که‌،روی‌ز ان‌لاتین‌کرگذاری‌شکل‌کلمهروش ‌ ای‌‌،[05] تحقیقدر ‌ ا ‌،ائر‌ح وفودر

ارائه‌شره‌‌افماده‌دقاوم‌است‌‌هم‌شکسمه‌و‌روی‌ح وفو‌‌ ین‌ح وف‌چسبنرگ ،‌ها‌سب ‌نگارش ‌فونت

‌خطوط‌دمن‌‌.است ‌این‌رو ‌ا مرا ‌در ‌و‌سپس‌ ای‌ه ‌،کلماتو هفت‌ویژگ ‌کلمه‌‌اسمخ اج‌شره

این‌‌.شود‌کلمه‌ ه‌کر‌شکل‌کلمه‌تبریل‌د ‌ها،این‌ویژگ ‌ ا‌اسمفاده‌از‌.شودد دمفاوت‌تشخیص‌داده‌

1 Hamming distance

Page 30: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

04

و‌دحل‌‌0نقطه‌iها،‌تقع ‌ش ق ،‌تقع ‌غ ،‌را ط‌‌حف هرونره،‌‌رونره،‌پایین‌ الا‌کاراکم ها‌شادل‌ویژگ

‌5-‌4شکل‌این‌ویژگ ‌ها‌در‌.‌شونر‌کر‌د ‌rو‌ i,c,x, o,n,l اشنر‌که‌ ه‌ت تیب‌ ا‌د ‌4تقاطع‌خط‌دیان

‌iرا ط‌‌eحف ه،‌‌dرونره،‌رونره‌و‌پایین الا c تقع ‌ش ق ‌و‌غ ،‌bدر‌این‌شکل‌.‌انرنشان‌داده‌شره

ی ‌‌که‌فقط‌‌tکاراکم ه‌طور‌دثال‌در‌اولین‌کرگذاری‌.‌دهرتقاطع‌خط‌دیان ‌را‌نشان‌د ‌fنقطه‌و‌

ا‌داشمن‌دو‌ویژگ ‌تقع ‌غ ‌‌‌xکاراکم در‌حالت‌دوم‌‌.است‌تفسی ‌شره‌lرونره‌دارد‌ ا‌کر‌‌ویژگ ‌ الا

‌ش ق ‌ صورت‌ ‌شودگذاری‌د کر‌xcو .‌ ‌حالت‌سوم ‌ویژگ ‌‌‌eکاراکم در ‌داشمن‌دو ‌تقع ‌‌حف ه ا و

‌eف د‌‌ ه‌دنحص ‌شره‌و‌ ه‌کر‌ت کیبدو‌ویژگ ‌ ا‌هم‌‌در‌این‌حالتکه‌‌شود‌نگاشت‌د ‌eش ق ‌ ه‌کر‌

‌یا نر‌اخمصاص‌د ‌ف . ‌داشمن‌کر‌شکل‌کلمهینر‌کرگذاری‌آ عر‌از ‌ ا ‌کر‌‌ی‌پ سش شکل‌کلمه‌و و

‌.شود‌دحاسبه‌د ‌9ریزی‌پویا‌آنسا‌ ا‌ نادهداخل‌اسناد‌دیزان‌شباهت‌ ین‌‌اتشکل‌کلم

‌این‌رو ‌ ‌ ا ‌دقایسه ‌OCRدر ‌است‌س یع‌ ا ‌05، ‌‌.ت ‌از ‌دادهدو ‌‌PATی‌‌پایگاه ای‌‌UW1و

‌ارزیا ‌این‌تحقیق‌اسمفاده‌شره‌است ا ‌ ا‌ ای‌اولین‌پایگاه‌داده‌ ه‌ت تیب‌‌F1و‌دقت،‌ف اخوان ‌.

که‌در‌این‌است‌ ‌2/1سمانهآدر‌UW1 ای‌پایگاه‌داده‌‌‌F1دقرار سم ین‌.‌است‌%90/22و‌‌70/20%،‌011%

‌.‌است‌%97/29و‌%‌55/02،‌%55/27 ه‌ت تیب‌ ا ‌ ا‌‌F1و‌دقت،‌ف اخوان ‌حالت‌

‌[05]های‌ساخماری‌تحقیق‌نمایش‌ویژگ :‌5-‌4شکل‌

‌توجه‌ ه‌این‌دوضوع‌که‌در‌ز ان ‌ع ‌و‌اردو‌کلمات‌از‌زی ا کلمات‌تشکیل‌های ‌داننر‌فارس ،

ه‌‌،‌ ا‌تخصیص‌ی ‌کر[07]در‌تحقیق‌.‌کلمات‌ ه‌جای‌ح وف‌دط ح‌است نری‌ ه‌زی شونر‌قطعهد

1 i-dot connector

2 Middle line intersection

3 Dynamic Programming

Page 31: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

09

،‌کر‌توصیف‌(داننر‌نقاط)های‌تشخیص‌ الا‌و‌پایین‌ها،‌نشانها،‌حلقهرونرهها،‌پایینرونرهه ‌ی ‌از‌ الا

‌در‌این‌تحقیق‌ کرهای‌ح وف‌ع ‌5-‌4شکل‌در‌.‌آیری‌شکل‌کلمات‌در‌ز ان‌ع ‌ رست‌د کننره

‌.نشان‌داده‌شره‌است

‌[07]‌کرهای‌ح وف‌ع :‌5-‌4شکل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

ایین‌تحقییق‌روی‌اسیناد‌‌‌‌.‌ اشر نری‌دبمن ‌ ‌جراسازی‌خطوط‌د ،‌رو ‌قطعه[00]در‌تحقیق‌

در‌این‌رو ،‌خطوط‌توسط‌پ وفاییل‌پ وجکشین‌افقی ‌از‌یگیریگ ‌جیرا‌‌‌‌‌‌.‌چاپ ‌فارس ‌ارائه‌شره‌است

ی‌پ سشی ‌‌را‌نوع‌و‌انرازه‌فونت‌سینری‌کیه‌شیادل‌کلمیه‌‌‌‌سپس‌ ای‌جسمجوی‌ی ‌کلمه‌ا م.‌انرشره

Page 32: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

05

ی‌شود‌ ه‌طوری‌کیه‌کلمیه‌‌ی‌پ سش ‌ ازنویس ‌د دورد‌نظ ‌است‌شناسای ‌شره‌و‌ ‌این‌اساس‌کلمه

ای‌شیادل‌تصیوی ‌‌‌ی‌ عیری‌پنجی ه‌‌در‌د حلیه‌.‌ اشینر‌های‌آن‌در‌سنر‌کادلا‌دشا ه‌د پ سش ‌و‌نمونه

یین‌‌ XNORپیکسل‌ ه‌پیکسل‌ح کت‌کی ده‌و‌تیا ع‌‌‌‌ی‌پ سش ‌روی‌تمام‌خطوط‌سنر‌تصوی یکلمه

.‌دهیر‌این‌تا ع‌دیزان‌شباهت‌را‌نشان‌د .‌شودی‌پ سش ‌و‌کلمات‌داخل‌دمن‌دحاسبه‌د تصوی ‌کلمه

در‌این‌د حله‌ عض ‌از‌کلمات‌دمن‌که‌دارای‌ یشم ین‌دیزان‌شباهت‌هسمنر‌ ه‌عنوان‌کانریر‌انمخیاب‌‌

‌و‌رونیره‌رونره‌و‌پایینها،‌تعراد‌ح وف‌ الاداننر‌تعراد‌حف ه‌های ای‌تشخیص‌نسای ،‌ویژگ .‌شونرد

هی ‌تصیوی ‌کانرییری‌‌‌‌.‌شونری‌قبل‌اسمخ اج‌د ی‌پ سش ‌و‌تصاوی ‌کانریر‌د حلهتعراد‌نقاط‌از‌کلمه

ی‌کلمیه‌پ سشی ‌در‌دیمن‌دشیخص‌‌‌‌‌ی‌پ سش ‌ اشر‌ ه‌عنوان‌نمونههای‌آن‌دنماظ ‌ ا‌کلمهکه‌ویژگ

‌.‌شودد

سنر‌تصوی ی‌‌445انر‌و‌سنر‌تصوی ی‌چاپ ‌که‌توسط‌رایانه‌ایجاد‌شره‌551این‌تحقیق‌روی‌

و‌%‌‌0/24 اخوان ‌ ا ‌ او‌ف%‌5/07و‌‌%5/27اسکن‌شره‌ارزیا ‌شره‌است‌که‌ ه‌ت تیب‌دقت‌ ا ‌ ا‌‌

عض ‌از‌کلمات‌‌7-‌4شکل‌‌در.‌نشان‌داده‌شره‌است‌5-‌4شکل‌این‌رو ‌در‌د احل‌ . اشرد 9/72‌%

‌.انرهای‌آنسا‌نمایش‌داده‌شرهفارس ‌و‌ویژگ

‌[00]د احل‌رو ‌تحقیق‌:‌5-‌4شکل‌

Page 33: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

05

‌[00]‌های‌ساخماری‌آنساکلمات‌فارس ‌و‌ویژگ ‌:7-‌4شکل‌

بندیقطعه بدونهای روش 2-2-2

هیای‌دبمنی ‌ ی ‌پنجی ه‌لغیزان‌سینر‌را‌دیورد‌‌‌‌‌‌‌‌‌ نری‌ ا‌اسمفاده‌از‌رو های‌دسمقل‌از‌قطعه‌رو

نری‌ ی ‌‌ نری‌و‌دسمقل‌از‌قطعهاز‌ه ‌دو‌رو ‌دبمن ‌ ‌قطعه‌[02،‌41]‌تحقیق.‌دهرد جسمجو‌ق ار‌

نیری‌‌دسمقل‌از‌قطعه‌های‌رو ‌[02] ا‌توجه‌ ه‌نمایج‌.‌های‌ع ‌اسمفاده‌ک ده‌استنوشمهروی‌دست

‌.‌دهر نری‌در‌ع ‌را‌نشان‌د های‌دبمن ‌ ‌قطعه‌درصر‌ سم ‌از‌رو ‌01تا‌‌5دقم ‌در‌حرود‌

-های‌دمصل‌ ای‌ه ‌خط‌اسمخ اج‌د ،‌ا مرا‌دولفه[02]‌تحقیق‌در نری‌در‌رو ‌دبمن ‌ ‌قطعه

اشیر‌‌ی‌اصل ‌آن‌دی ‌ی‌دمصل ‌که‌ رنههای‌دمصل ‌داننر‌نقاط‌ ه‌نزدیکم ین‌دولفهدولفهشونر‌سپس‌

در‌ز یان‌ع ی ‌‌‌.‌شیونر‌ نری‌دی ‌های‌دمصل‌خوشهی‌ عری‌این‌دولفهدر‌د حله.‌شودتخصیص‌داده‌د

توانیر‌یی ‌‌‌وجود‌یا‌عرم‌وجیود‌آن‌دی ‌‌‌،شونر‌ ه‌همین‌دلیلآغاز‌د ‌"الف" سیاری‌از‌کلمات‌ ا‌ح ف‌

کلمات‌ی ‌کلمه‌هسیمنر‌ییا‌هی ‌کیرام‌یی ‌‌‌‌‌‌ی‌دجاور‌د وط‌ ه‌زی خص‌قوی‌ اشر‌که‌آیا‌دو‌خوشهشا

شیبکه‌‌‌از.‌شیود‌ی‌دجیاور‌اسیمخ اج‌دی ‌‌‌ویژگ ‌از‌ه ‌دو‌خوشیه‌‌2.‌شونری‌جراگانه‌دحسوب‌د کلمه

اسیمفاده‌‌اسیت‌‌کلمات‌ ین‌کلمات‌یا‌زی ‌فاصله‌،ی‌دجاور ین‌دو‌خوشه‌فاصله ای‌تعیین‌اینکه‌عصب ‌

د یوط‌ یه‌‌‌ ای‌تشخیص‌اینکه‌‌این‌دو‌خوشه.‌دهررا‌نشان‌د ی‌دجاور‌دو‌خوشه‌0-‌4شکل‌.‌شودد

‌.گی نردورد‌آزدون‌ق ار‌د هم،‌‌ی‌جرا‌ازکلمه‌هسمنر‌یا‌دو‌کلمهی ‌

Page 34: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

05

دو‌‌0کلمیه‌‌ دحیاط‌ ی‌‌‌کیادر‌‌طول‌اولین‌و‌دودین‌خوشیه،‌تفیاوت‌ یین‌‌‌:‌انر‌ازرتویژگ ‌عبا‌2این‌

ی‌های‌دمصیل‌خوشیه‌‌ی‌دوم،‌تعراد‌دولفهی‌اول‌و‌در‌خوشهدر‌خوشه‌"الف"وجود‌یا‌عرم‌وجود‌ح ف‌

ی‌دحیرب‌‌دو‌خوشه،‌نسبت‌ ین‌دجمیوع‌ رنیه‌‌‌4ی‌دحربکمم ین‌فاصله‌ ین‌ رنهی‌دوم،‌اول‌و‌خوشه

‌.‌ اشرد ی‌ه ‌دو‌خوشه‌ی‌دحر ‌که‌در گی نره رنهدو‌خوشه‌ ه‌

خیط‌‌‌.است‌ ه‌جای‌تصوی ‌کلمه‌کانریر،‌تصوی ‌خط‌ عنوان‌ورودی‌، نریرو ‌دسمقل‌از‌قطعهدر‌

‌9 نری‌دبمن ‌ ‌دو‌یا‌چنر‌ح ف‌دمصل‌ یه‌هیم‌‌شبیه‌ ه‌الگوریمم‌قطعه‌ ه‌قطعات ‌ اساس‌الگوریمم

همیه‌ت کیبیات‌‌‌‌.شونر نری‌روی‌خط‌دشخص‌د در‌واقع‌نقاط‌قطعه‌.شودتقسیم‌د ‌[40]‌در‌تحقیق

نظ ‌گ فمه‌ واقع ‌اجزاء‌دمصل‌دجاور‌ عنوان‌نواح ‌ القوه‌که‌کلمه‌دطلوب‌دمکن‌است‌نمودار‌شود،‌در

از‌سمت‌چیپ‌خیط‌‌‌که‌کنر،‌ی ‌پنج ه‌لغزان‌را‌اسمفاده‌د ‌5رو ‌ کار‌رفمه‌در‌پویش‌خط.‌شره‌است

یی ‌‌راقل‌طیول‌و‌‌حی ‌داده‌شره‌‌پ سش ‌ی ای‌کلمه.‌کنرو‌ ه‌سمت‌راست‌ح کت‌د ‌شرهش وع‌

‌.شودد نظ ‌گ فمه‌‌در ‌اساس‌حراقل‌و‌حراکث ‌طول‌دجموع‌کاراکم ها‌حراکث ‌طول‌

‌ ای‌ی ‌نقطه‌داده‌شره‌.‌کنرروی‌ه ‌خط‌ش وع‌د ‌p نری‌الگوریمم‌پویش‌از‌ه ‌نقطه‌قطعه

طور‌دشا ه‌‌دارد،‌ عنوان‌ی ‌نقطه‌ش وع‌دعمب ‌و‌یا نری‌وجود‌اگ ‌فضای‌افق ‌سمت‌چپ‌نقطه‌قطعه

نری‌وجود‌دارد،‌ عنوان‌ی ‌نقطه‌پایان ‌دعمب ‌درنظی ‌گ فمیه‌‌‌فضای‌افق ‌سمت‌راست‌نقطه‌قطعهاگ ‌

نیری‌‌گی د‌که‌در‌رنج‌قطعات‌ ین‌دو‌نقطه‌قطعهنظ ‌د ‌کلمات‌کانریر‌را‌طوری‌در‌،الگوریمم.‌شودد

دقایسه‌نمایج‌‌. ‌نقطه‌پایان ‌دعمب ‌استی‌ و‌ی ‌نقطه‌ش وع‌دعمب ‌‌ ق ار‌داشمه‌ اشر‌که‌‌ و‌‌

‌.نشان‌داده‌شره‌است‌2-‌4شکل‌ ین‌این‌دو‌رو ‌در‌

1 Bounding Box

2 Convex Hull

3 Ligature-based segmentation algorithm

4 Line scanning

Page 35: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

07

‌[02]‌ نری‌کلمات‌ع قطعه‌:0-‌4شکل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

[02]‌ نری‌در‌ع دقایسه‌دقت‌در‌دو‌رو ‌دبمن ‌و‌دسمقل‌از‌قطعه‌:2-‌4شکل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

.‌کنر نری‌خط‌و‌کلمه‌در‌اسماد‌چاپ ‌قریم ‌را‌ارائه‌د دسمقل‌از‌قطعه‌رو ی ‌‌[44]تحقیق‌

اولین‌د حله‌در‌عنوان‌ توسط‌الگوریمم‌نقشه‌خود‌سازدانره‌،دمصل‌هایدولفه نری‌اسمفاده‌از‌خوشه

Page 36: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

00

،‌خطوط‌ ا‌در‌نظ ‌گ فمن‌اطلاعات‌زی ‌SOM عر‌از‌آدوز ‌توسط‌‌.است‌شرهگذاری‌پیشنساد‌انریس

‌شونری‌دمصل‌دوجود‌در‌خط‌توصیف‌د ای‌ه ‌دولفه این‌اطلاعات‌شادل‌شماره‌صفحه،‌سط ‌و‌.

ی‌ ه‌دولفه‌SOMی‌ت ین‌ن ون‌شبکهنزدی ‌Yو‌‌Xی‌دمصل‌در‌خط،‌دخمصات‌دکان ‌دولفه‌سمون

‌ ا‌دری‌پ سش ‌در‌سنر‌های‌کلمهسپس‌نمونه.‌دولفه‌دمصل‌استدحاط‌ ‌‌کادردمصل‌و‌دخمصات‌

تغیی ‌یافمه‌که‌ع ض‌کلمه‌را‌در‌دحاسبه‌فاصله‌‌(DTW)0نظ ‌گ فمن‌ی ‌الگوریمم‌پیچش‌زدان‌پویا

‌.‌نمایش‌داده‌شره‌است‌01-‌4شکل‌د احل‌این‌رو ‌در‌‌.انرگی د،‌دشخص‌شره د در

‌[44]د احل‌تحقیق‌‌:01-‌4شکل‌

و‌‌4ای‌از‌توصییفگ های‌هیسیموگ ام‌گ ادییان‌‌‌شره‌است‌از‌شیبکه‌‌‌ارائه‌[49]در‌کاری‌که‌اخی اً‌در‌

ی ای‌ ازنمیای ‌ سمی ‌کلمیه‌‌‌‌‌‌.شره‌اسیت‌‌‌ت‌پنج ه‌لغزان‌ ای‌سنر‌و‌کلمه‌دورد‌جسمجو‌اسمفادهرهیاف

قا لییت‌تمیایز‌‌‌‌و‌از‌ی ‌ ازنمیای ‌ یا‌‌‌9رو ‌ رون‌ناظ ‌از‌داشین‌ دار‌پشمیبان‌دثال ‌دورد‌جسمجو‌در

یا‌‌.‌شره‌است‌‌ نری‌دجرد‌ سم ین‌نواح ‌ ازیا ‌شره،‌اسمفاده ای‌رتبه‌[45]‌5 سم ‌ ه‌اسم‌ دار‌فیش

1 Dynamic Time Wrapping (DTW)

2 Histogram of Gradient (HOG)

3 Exemplar SVM 4 Fisher Vector

Page 37: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

02

‌.ن‌در‌حافظه‌رم‌نگسراری‌شیونر‌همزداتواننر‌سازی‌صورت‌گ فمه‌تعراد‌اسناد‌زیادی‌د توجه‌ ه‌فش ده

پییش‌‌‌تواننیر‌از‌توجه‌ ه‌اینکه‌فاصله‌ ین‌توصیفگ های‌هیسیموگ ام‌گ ادییان‌کیوانمیزه‌شیره‌دی ‌‌‌‌‌‌و‌ ا

نشان‌‌00-‌4شکل‌د احل‌این‌سیسمم‌در‌‌.کنرت ‌عمل‌د ‌شره‌ اشنر،‌پنج ه‌لغزان‌ سیار‌س یع‌دحاسبه

‌.داده‌شره‌است

[49]شمای‌کل ‌رو ‌دع ف ‌شره‌در‌:‌00-‌4شکل‌

تشخیصبندی براساس روش تقسیم 2-9

اساس‌دو‌رهیافت‌کل ‌تطبیق‌قالب‌و‌دبمنی ‌ ی ‌‌‌کلمه‌در‌ خ ‌از‌دقالات‌ ‌یهای‌جسمجو‌رو

در‌.‌توانر‌در‌سطح‌پیکسل‌یا‌ویژگ ‌انجیام‌شیود‌‌رو ‌تطبیق‌تصوی ‌د ‌.شونر نری‌د یادگی ی‌دسمه

و‌تصاوی ‌کلمات‌‌ پ سش‌یتصوی ‌کلمههای‌دمناظ ‌‌رو ‌تطبیق‌پیکسل‌ ه‌پیکسل‌فاصله‌ ین‌پیکسل

اسیمخ اج‌شیره‌و‌‌‌‌‌هاویژگ ‌ی‌ازتعراد‌،رو ‌تطبیق‌دبمن ‌ ‌ویژگ ‌در.‌شوددحاسبه‌د داخل‌اسناد‌

‌.‌گ ددد صورت‌ی ‌ دار‌ارائه‌شره‌است‌و‌شباهت‌ ین‌تصاوی ‌ ا‌دقایسه‌ دارهای‌آنسا‌تعیین‌

Page 38: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

41

های‌س اسی ی‌دبمنی ‌ ی ‌پیکسیلِ‌‌‌‌‌ی ‌تصوی ‌کلمه‌را‌ وسیله‌ویژگ ‌های‌دبمن ‌ ‌پیکسل،رو

‌رونیر‌های ‌که‌ ای‌نمایش‌هی ‌تصیوی ‌ کیار‌دی ‌‌‌‌و‌دمان‌0سطح‌تصوی ‌داننر‌خودهمبسمگ ‌شرت‌نور

هیای‌‌ز یان‌تواننیر‌روی‌‌و‌د ای‌اسناد‌ ا‌کیفیت‌پایین‌دناسب‌هسمنر‌‌هارو این‌.‌رنکند ‌پ داز

کیه‌‌ول ‌از‌این‌جست‌‌هسمنرسطح‌ویژگ ‌وا سمه‌ ه‌ز ان‌‌هایپ داز از‌ط ف‌دیگ ‌.‌رندخملف‌کار‌کن

-دی ‌‌سوددنر‌کننر‌و‌نیازی‌ ه‌آدوز ‌نرارنرگذاری‌د و‌انریس‌‌داده ه‌راحم ‌ی ‌پ سش‌را‌تشکیل‌

شیره‌‌‌قالب‌کارا‌دع ف عنوان‌ی ‌الگوریمم‌تطبیق‌‌‌شره‌ ه‌‌های‌دط ح‌در‌ سیاری‌از‌رو DTW ‌. اشنر

‌.[47-45]‌است

صیورت‌‌‌‌دبمن ‌ ‌یادگی ی‌سع ‌شره‌است‌تا‌تصوی ‌کلمیه‌ یه‌‌‌تحقیقات‌انجام‌شرهدر‌ سیاری‌از‌

آن‌‌4درل‌دخفی ‌دیارکوف‌‌ ‌همچون‌یهارو های ‌ ا‌طول‌دمغی ‌اسمفاده‌شود‌و‌ ا‌‌ی ‌توال ‌از‌ویژگ

پذی ت ‌از‌ دارهای‌ویژگی ‌ یا‌طیول‌ثا یت‌اسیت‌و‌‌‌‌‌‌طول‌دمغی ‌ویژگ ‌ سیار‌انعطاف.‌ نری‌کننررا‌رده

تواننر‌ ا‌تغیی ات‌دخملف‌شیوه‌نگیار ‌و‌طیول‌کلمیه‌وفیق‌پییرا‌‌‌‌‌‌ه‌ سم ‌د شره‌که‌ ه‌دلیل‌اینک‌‌دیره

دمأسیفانه‌ایین‌رو ‌دو‌‌‌‌.[40،‌42]‌کلمه‌شیره‌اسیت‌‌‌یکننر‌دنج ‌ ه‌نمایج‌خو ‌در‌کارهای‌جسمجو

را‌‌9تواننیر‌کلمیات‌خیارج‌از‌ف هنیگ‌لغیات‌‌‌‌‌های‌ ا‌نظیارت‌نمی ‌‌‌اولاً،‌ سیاری‌از‌رو .‌دارد‌ضعف‌اصل

شیره‌اسیت،‌‌‌‌‌کلیری‌که‌در‌زدیان‌آدیوز ‌شیناخمه‌‌‌‌یجسمجو‌کننر،‌یعن ،‌فقط‌تعراد‌دحرودی‌کلمه

هیا‌‌‌ها‌ ا‌توال ‌ویژگی ‌ثانیاً،‌ ه‌دلیل‌اینکه‌این‌رو .‌پ سش ‌ کار‌گ فمه‌شود‌یعنوان‌کلمه‌‌توانر‌ هد

نمیجیه‌‌‌در.‌اسیت‌س وکار‌دارنر،‌دحاسبه‌فاصله‌ یین‌کلمیات‌در‌زدیان‌آزدیون‌دعمیولاً‌ سییار‌آهسیمه‌‌‌‌‌‌‌‌

ایین‌‌‌. نیری‌شیونر‌‌کارگی ی‌نیسمنر‌و‌حمماً‌ ایر‌کلمیات‌قطعیه‌‌‌های ‌داننر‌پنج ه‌لغزان‌قا ل‌ ه‌رهیافت

ای‌ یزرگ‌ ی ای‌‌‌حیال‌پایگیاه‌داده‌‌ سی ‌دارد‌ولی ‌‌‌ ای‌اسناد‌دارای‌چنر‌نویسنره‌نمیایج‌دطلیو ‌‌‌رو

نیرهای ‌‌ کیار دت ین‌رده‌نییز‌یکی ‌از‌پ‌‌‌درل‌دخف ‌دارکوف.‌آدوز ‌چنین‌سیسمم ‌دورد‌نیاز‌است

‌. ‌ کار‌گ فمه‌شره‌استیهااست‌که‌در‌چنین‌سیسمم

1 Intensity autocorrelation

2 Hidden Markov Models

3 Out Of Vocabulary (OOV)

Page 39: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

40

مبتنی بر تطبیق الگو هایروش 2-9-4

ارائیه‌داده‌‌‌ی‌اردو‌نوشیمه‌ ازیا ‌اسناد‌دستی‌ ا‌کلمهی‌جسمجوی‌‌روش ‌در‌زدینه‌[91]‌تحقیق

دیلییون‌‌‌011اردو‌ز ان‌رسم ‌پاکسمان‌و‌گ وه‌ زرگ ‌از‌ساکنین‌هنروسمان‌است‌کیه‌ یشیم ‌از‌‌‌.‌است

هیای‌‌‌دمون‌اردو‌شباهت‌زیادی‌ ه‌دمون‌ع ‌و‌فارس ‌دارد‌که‌کلمات‌آن‌ ا‌ت کیب.‌کننره‌دارد‌صحبت

هیم‌ یا‌‌‌‌کلمیات‌جزئی ‌‌.‌شونر‌انر‌ساخمه‌د ‌نادیره‌شره (PWs)0جزئ ی‌کلمات‌که‌کلمهدخملف ‌از‌زی

‌[91]‌چارچوپ‌رو ‌ ازیا ‌اطلاعات‌تحقییق‌.‌شونر‌های‌دمفاوت ‌از‌ح وف‌اصل ‌اردو‌ایجاد‌د ‌ت کیب

‌گذاری‌و‌ ازیا شاخص:‌شود‌ ه‌دو‌قسمت‌اصل ‌تقسیم‌د

.‌است‌PWsها‌از‌ه ‌‌های‌جزئ ‌و‌اسمخ اج‌ویژگ ‌ نری‌دمن‌ ه‌کلمه‌گذاری‌شادل‌قطعهشاخص

ی‌‌در‌ ازیا ،‌ی ‌دقایسه.‌شونر‌یافمن‌اجزای‌دمصل‌در‌ی ‌دمن‌ این ی‌اسمخ اج‌د ‌‌کلمات‌جزئ ‌ ا

‌تصوی ‌کلمه‌PWsای‌ ین‌‌د حله‌چنر ‌شود‌دوجود‌در‌سنر‌انجام‌د ‌PWsی‌پ سش ‌و ی‌در‌د حله.

‌شاخص ‌ ای‌ه ‌ویژگ ‌PWsگذاری، ‌از ‌شادل‌ویژگ ‌ی ‌دجموعه ‌ویژگ ‌ها ‌ دار های‌‌های‌اسکال ،

های‌اسکال ‌شادل‌‌ویژگ .‌شود‌افق ‌اسمخ اج‌د ‌شره‌‌های‌تع یف‌شره‌عمودی‌و‌ دار‌ویژگ ‌‌تع یف

شره‌عمودی،‌روی‌‌‌های‌تع یف‌ویژگ ‌. اشر‌ی‌جزئ ‌د ‌و‌ناحیه‌دحرب‌ه ‌کلمه‌طول‌ ه‌ع ض‌نسبت

جزئ ‌دحاسبه‌شره‌و‌شادل‌پ وفایل‌ الا،‌پ وفایل‌پایین،‌پ وژکشن‌عمودی‌و‌گذر‌‌یسمون‌ی ‌کلمه

جزئ ‌دحاسبه‌شره‌و‌‌یشره‌افق ،‌روی‌سط ‌ی ‌کلمه‌‌های‌تع یف‌زدینه‌است‌و‌ویژگ جوه ‌ ه‌پس

‌.است راست‌و‌چپ‌شادل‌پ وژکشن

‌د حله‌ ‌پایگاه‌‌های‌کلمه‌ای‌ ای‌یافمن‌نمونه‌ی‌ ازیا ‌ی ‌انطبا ‌سه‌د حلهدر ی‌پ سش ‌در

شود‌ ه‌این‌صورت‌‌های‌اسکال ‌اساس ‌انجام‌د ‌ی‌انطبا ‌روی‌ویژگ ‌اولین‌د حله.‌شود‌داده‌انجام‌د

دمفاوت‌هسمنر‌حذف‌‌ی‌پ سش کلمه‌PWsو‌ناحیه‌دحرب‌ ا‌‌دیرکه‌از‌نظ ‌نسبت‌‌PWsکه‌تمام‌

1

Partial words(PWs)

Page 40: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

44

‌شود‌انجام‌د ‌DTWو‌اعمال‌ی ‌‌PWsهای‌ داری‌‌انطبا ‌اصل ‌ ا‌اسمفاده‌از‌ویژگ .‌شونر‌د در‌.

انر‌ ا‌اسمفاده‌از‌ی ‌پنج ه‌لغزان‌که‌روی‌ی ‌خط‌در‌دمن‌شناسای ‌شره‌PWsی‌آخ ‌انطبا ،‌‌د حله

‌.ظاه ‌شونردورد‌نظ ‌ی‌پ سش ‌ ا‌یگریگ ‌ادغام‌شره‌تا‌زدان ‌که‌ صورت‌کلمه

کلمه‌ ‌تصوی ‌‌011نوشمه‌که‌شادل‌دموسط‌‌تصوی ‌دست‌01ی ‌پایگاه‌داده‌ ا‌‌رویسیسمم‌‌این

عمودی‌‌پ وژکشن.‌انمخاب‌شره‌است‌پ سش ی‌کلمه‌‌005آزدون‌ی‌در‌د حله‌.است‌ارزیا ‌شره‌است

انطبا ‌در‌کلمات‌جزئ ‌را‌ ه‌صورت‌صحیح‌انجام‌‌%05که‌در‌حرود‌‌است‌ت ین‌ویژگ ه‌عنوان‌دوث

‌دهر‌د ‌استگزار ‌شره‌‌%‌7/74 ا ‌ ا‌ی‌انطبا ‌اولیه‌د حله‌در F1 ای‌‌ یشم ین‌دقرار. ‌در‌این.

جزئ ‌کل‌‌یهسمنر‌که‌دثلا‌ ای‌پنج‌کلمه ‌کلمه‌‌PWsشادل‌ی ‌تا‌پنج‌‌پ سش سیسمم‌کلمات‌

[91]د احل‌رو ‌تحقیق‌‌.کشر‌ثانیه‌طول‌د 07/4جزئ ‌‌ی اشر‌و‌ ای‌ی ‌کلمه‌د ‌ثانیه‌‌95/5زدان

‌.شان‌داده‌شره‌استن‌09-‌4شکل‌و‌‌04-‌4شکل‌در‌

‌[91]‌ی‌پ سش ‌دورد‌نظ در‌دمن‌ ه‌ازای‌کلمه‌PWsتشخیص‌ :04-‌4شکل‌

Page 41: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

49

‌[91]‌ی‌پ سش ‌در‌دمنی‌کلمه ا‌یگریگ ‌و‌یافمن‌نمونه‌PWsادغام‌ :09-‌4شکل‌

روی‌اسناد‌چاپ ‌فونت‌‌انرازهو‌شناسای ‌‌اتکلم‌جسمجوی‌‌در‌زدینه‌تحقیقاولین‌،‌[90]د جع‌

-زی ‌فونت‌داننر‌تعراد‌انرازهاز‌های‌دسمقل‌‌در‌این‌رو ‌ ا‌اسمفاده‌از‌تعرادی‌ویژگ ‌. اشر‌د فارس ‌

‌ ‌‌نسبت‌طول‌ ه‌ع ضکلمات، ی ‌کلیر‌واژه‌‌،کلماتزی ‌0ای‌های‌شبکه‌ویژگ کلمات‌و‌زی ‌تصوی در

‌فارس ‌توصیف ‌یافت‌د ، ‌و ‌‌.شود‌جسمجو ‌شناسای ‌د ‌انرازههمچنین ‌سنر ‌شود‌فونت‌تصوی این‌.

‌ ‌شادل ‌داده ‌پایگاه ‌ی ‌روی ‌ارز‌511دیرگاه ‌فارس ‌سنر ‌ایاتصوی ‌شره ‌ن خ‌ ‌که ‌حال ‌در ست

این‌دیرگاه‌‌.دره‌استآ ه‌دست‌‌%5/75و‌ن خ‌ف اخوان ‌‌%‌9/24ن خ‌دقت ،%4/25فونت‌‌انرازهشناسای ‌

وقم ‌ی ‌کار ‌ی ‌کلیر‌ [90]‌در‌دیرگاه‌. اشر‌ ا‌کم ‌انطبا ‌ ای‌اسناد‌ع ‌و‌اردو‌دناسب‌د

فونت‌‌نوعا مرا‌‌ر،کنر‌ ای‌جسمجو‌در‌ی ‌تصوی ‌سن‌وارد‌د ‌GUIپایگاه‌داده‌واژه‌فارس ‌را‌از‌دیان‌

فونت‌اسناد‌ ازنویس ‌و‌اصلاح‌شره‌‌نوع‌ ‌طبق‌ پ سشی‌سپس‌کلمه‌.شود‌سنر‌تشخیص‌داده‌د

های‌د زی‌تصوی ‌کلمه‌اصلاح‌شره‌ساخمه‌‌ی‌ عری‌قاب‌در‌د حله‌.شود‌ن‌ساخمه‌د آاست‌و‌تصوی ‌

‌.شونر‌اسمخ اج‌د که‌در‌ الا‌ذک ‌شر‌فونت‌‌انرازههای‌دسمقل‌‌ خ ‌از‌ویژگ ‌و‌شره

‌شبکهویژگ ‌زی ‌های ‌ه ‌ ای ‌ناحیهای ‌ ا ‌د کلمه ‌اسمخ اج ‌انطباق ‌شود‌ نری .‌ ‌رو ‌در این

شود‌ ای‌دثال‌‌ نری‌د ‌ ‌ناحیها‌در‌ زرگم ین‌جست‌wو‌ع ض‌‌hکلمه‌ ا‌طول‌‌،‌ی ‌زی ‌ نری‌ناحیه

صورت ‌که‌ه‌شود‌ ‌ نری‌د ‌کلمه‌ صورت‌افق ‌و‌از‌چپ‌ ه‌راست‌تقسیمزی ‌کادر‌دحاط‌ ‌h<wاگ ‌

1

Mesh feature

Page 42: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

45

شود‌‌ نری‌د ‌عمودی‌از‌ الا‌ ه‌پایین‌تقسیم‌ صورتکادر‌دحاط‌‌w<hاگ ‌و‌‌.است‌hع ض‌ه ‌ناحیه‌

-ناحیه.‌شودهای‌قلم‌دحاسبه‌د و‌در‌ه ‌ناحیه‌تعراد‌پیکسل‌.است‌‌w صورت ‌که‌ارتفاع‌ه ‌ناحیه‌

‌.نمایش‌داده‌شره‌است05-‌4شکل‌ نری‌انطباق ‌در‌

[90]‌‌ای‌در‌تحقیق نری‌انطباق ‌و‌اسمخ اج‌ویژگ ‌شبکهناحیه:‌05-‌4شکل‌

های‌اسمخ اج‌شره‌کلمه‌دورد‌پ سش‌در‌سنر‌تصیوی ی‌و‌ییافمن‌‌‌‌ ای‌انطبا ‌و‌جسمجوی‌ویژگ

یه‌ایین‌صیورت‌کیه‌در‌اولیین‌د حلیه‌تعیراد‌‌‌‌‌‌‌‌‌.دوارد‌دشا ه،‌از‌انطبا ‌چنر‌سطح ‌اسمفاده‌شره‌است

ن‌در‌هیای‌یکسیا‌‌‌آنسا‌در‌نظ ‌گ فمه‌شیره‌و‌نمونیه‌‌‌طول‌ ه‌ع ضکلماتِ‌کلمه‌دورد‌پ سش‌و‌نسبت‌‌زی

ی‌‌های‌کلمات‌یافت‌شره‌از‌د حلیه‌‌ی‌ عری‌انطبا ،‌فقط‌روی‌نمونه‌د حله.‌شود‌سنر‌تصوی ی‌پیرا‌د

هیا‌‌‌دهر‌زی ا‌ ا‌اعمیال‌هی ‌نیوع‌از‌ویژگی ‌‌‌‌‌این‌کار‌عملیات‌دحاسبات ‌را‌کاهش‌د .‌شود‌قبل‌اعمال‌د

عیر‌از‌ایین‌‌‌.‌دشیو‌‌ی‌جسمجو‌کوچ ‌و‌کوچکم ‌د ‌ی‌ناد تبط‌کنار‌گذاشمه‌شره‌و‌حوزه‌کلمه‌یتعراد

کلمات‌داخیل‌سینر‌تصیوی ی‌کیه‌‌‌‌‌ای‌اعمال‌شره‌و‌‌های‌شبکه‌ویژگ ‌کلمه‌و‌د حله‌تعراد‌اجزاء‌ه ‌زی

اشنر‌ ه‌عنیوان‌جیواب‌‌‌های‌کلمه‌دورد‌پ سش‌را‌دارا‌د ‌های‌ذک ‌شره‌دمناظ ‌ ا‌ویژگ ‌ی‌ویژگ ‌همه

‌و‌ پ سشی‌ی‌کلمیات‌از‌کلمیه‌‌‌ ه‌دنظیور‌اسیمخ اج‌زیی ‌‌‌در‌این‌تحقیق‌.‌شونر‌صحیح‌در‌نظ ‌گ فمه‌د

در‌حیین‌ارزییا ‌ایین‌‌‌‌‌.عمودی‌اسیمفاده‌شیره‌اسیت‌‌‌‌پ وژکشناز‌پ وفایل‌‌داخل‌سنر‌تصوی یکلمات‌

نیری‌‌‌ نری‌خطیوط‌دیمن‌و‌قطعیه‌‌‌‌ ه‌قطعه‌د وطدیرگاه‌دشاهره‌شر‌که‌دلیل‌اصل ‌خطا‌این‌دیرگاه‌

کلمیات‌اصیل ‌‌‌زی ی‌ خی ‌‌افمادگ ‌قیاب‌دی ز‌‌هم‌این‌دساله‌ ه‌دلیل‌روی‌‌.کلمات‌استکلمات‌ ه‌زی

‌‌.دنفصل‌در‌جست‌عمودی‌است

Page 43: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

45

‌تیاریخ ‌ کمیب‌ یشیره‌ اسکن تصاوی در کلمات یا دکان ای کادل ینرآف ی ‌]94[‌در‌تحقیق

کمیاب‌ درصیفحات‌ دوجیود‌ زی کلمیات‌ ا میرا‌ ینیر،‌آف دراین .شره‌است ارائه ع ‌و فارس ‌دسمنویس

و هاپ وفایل شادل ویژگ نوع‌دو دراداده.‌شودد ذخی ه زی کلمات این دکان اطلاعات و شره اسمخ اج

ین شباهت دعیار گ فمن نظ در ا عر، ید حله در.‌شودد اسمخ اج زی کلمات تصاوی از نریناحیه

‌ارز هیم‌ هیای‌ خوشیه‌ در زی کلمات ، اقلیرس فاصله و‌DTW ازدعیارهای ت کیب صورت هاویژگ این

درون را ایکلمیه‌ کیار ،‌‌اگ حال .شونرد گذاری چسب هاخوشه هم، درنسایت.‌شونرد نری طبقه

هیا،‌ خوشیه‌ در دوجیود‌ زی کلمیات‌ تمیام‌‌ یه‌ د یوط‌ اطلاعات داشمن ا دهر، ق ار جسمجو دورد کماب

کمیاب‌ یی ‌ روی‌ ی ‌ ‌الگیوریمم‌ این .گ دد د ارائه کار ه کماب‌ در کلمه آن وقوع احممال دکانسای

گ فمیه‌‌‌قی ار‌ آزدیایش‌ دیورد‌ ی جنیر‌ دانشگاه د کزی یکما خانه در دوجود فارس نویسدست تاریخ

.است

صورت‌پیکسل ‌ یا‌اسیمفاده‌‌‌‌‌و‌تطا ق‌آن‌ ه‌ی‌پ سش ا‌در‌نظ ‌گ فمن‌کلمه‌[99،‌95]‌تحقیقدر‌

نری‌شیره‌از‌سینر،‌تصیوی ‌ یاین ی‌جرییری‌‌‌‌‌‌و‌کلمات‌کانریرا‌قطعهی‌پ سش ‌ این ی‌کلمه‌XORاز‌

هیای ‌‌‌ویژگی ‌.‌آییر‌دیزان‌شباهت‌ ه‌دست‌د ‌0س شود‌که‌ ا‌اسمفاده‌از‌نگاشت‌فاصله‌اقلیرحاصل‌د

البمه‌.‌اسمفاده‌ق ارگ فمه‌است دورد‌رو در‌این‌ی‌پ سش ‌کلمه‌نسبت‌طول‌ ه‌ع ضچون‌دساحت‌و‌

ا‌تبریل‌کلمه‌دورد‌جسمجو‌و‌کلمات‌کانریرا‌نسبت‌ ه‌هم‌سع ‌در‌پیرا‌ک دن‌حراقل‌هزینیه‌‌‌[95]در‌

تی ین‌‌‌ یزرگ‌.‌کنر سم ی‌را‌ارائه‌د ‌را‌دارد‌که‌نسبماً‌نمایج‌‌4اساس‌دجموع‌د عات‌اخملافات‌تطبیق‌

همچنیین‌‌.‌اسیت‌‌9 ه‌تنوع‌شییوه‌نگیار ‌و‌تبیریلات‌ایفیاین‌‌‌‌شره‌حساس‌ ودن‌زیاد‌‌‌دشکل‌رو ‌ارائه

طیور‌‌‌ است‌و‌ ا‌تغیی ‌نویسنره‌یا‌تنوع‌آن‌دقت‌نمایج‌ یه‌‌5شره‌ سیار‌وا سمه‌ ه‌نویسنره‌‌های‌ یان‌رو

1 Euclidean Distance Mapping (EDM)

2 Sum of Squared Differences(SSD)

3 Affine Transform

4 Writer-dependent

Page 44: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

45

ای‌ سبود‌دادن‌نمایج‌در‌شی ایط ‌کیه‌‌‌‌0هیگنز-الگوریمم‌اسکات‌و‌لنگوت‌.یا رآوری‌کاهش‌د شگفت

-هرف‌از‌الگوریمم‌اسیکات‌و‌لنگیوت‌‌.‌[99،‌95] اسمفاده‌ق ار‌گ فت‌دورداشر،‌ تبریلات‌ایفاین‌رخ‌داده‌

کیه‌‌اسیت،‌وقمی ‌‌‌jو‌‌iهیگنز‌دحاسبه‌ی ‌فاصله‌جریر‌جست‌ سبود‌نمایج‌تناظ ‌ ین‌دو‌دجموعه‌نقیاط‌‌

این‌رو ‌نسبت‌ ه‌رو ‌نگاشت‌فاصله‌اقلیرسی ‌ سییار‌ سمی ‌عمیل‌‌‌‌‌.‌تبریل‌ایفاین‌ ین‌آنسا‌وجود‌دارد

پیذی فت‌و‌‌دحاسبات‌ سیار‌کنر‌انجام‌د زرگ‌ی ‌دات یس‌ ‌‌SVDخاط ‌نیاز‌ ه‌دحاسبه‌ک د‌ادا‌ هد

ی ‌تبریل‌ایفاین،‌تبریل ‌است‌)‌. جاست‌هنوز‌دشکل‌وا سمگ ‌ ه‌نویسنره‌و‌فونت‌نگار ‌همچنان‌پا

انیر،‌‌یعن ‌همه‌نقاط ‌که‌در‌ا مرا‌روی‌ی ‌خط‌ق ار‌گ فمه.‌کنرحفظ‌د ‌خط ‌نسبت‌فواصل‌راکه‌هم

خیط‌ عیر‌از‌تبیریل‌همچنیان‌‌‌‌‌داننر‌و‌دثلاً‌وسط‌پارهروی‌ی ‌خط‌ اق ‌د ‌پس‌از‌تبریل‌نیز‌همچنان

داننر‌و‌دوازی‌ ودن‌خطیوط‌حفیظ‌‌‌در‌این‌تبریل‌خطوط‌دسمقیم،‌دسمقیم‌ اق ‌د .‌نقطه‌دیان ‌است

‌(.های ‌از‌تبریل‌ایفاین‌هسمنرانقباض،‌انبساط،‌تجانس،‌انعکاس،‌دوران‌و‌انمقال‌نمونه.‌شودد

ی ای‌تطبییق‌‌‌‌Hausdorffطح‌پایین،‌انطبا ‌در‌سطح‌پیکسل،‌رو ‌فاصیله‌‌ عنوان‌ی ‌تطبیق‌س

.‌شیود‌‌هیای‌تصیوی ‌اسیمفاده‌دی ‌‌‌‌‌تصوی ‌کلمه‌ ه‌دلیل‌سادگ ‌و‌حساسیت‌نسبت‌ ه‌تغیی ات‌دشخصیه‌

گی ی‌اینکه‌چه‌دقرار‌دو‌دجموعیه‌پیکسیل‌دور‌از‌‌‌ها‌را‌ ا‌انرازهشباهت‌ ین‌پیکسل‌Hausdorffفاصله‌

‌.کنرد ‌همریگ ‌هسمنر‌را‌ارائه

دار‌تیلا ‌کی د‌ یا‌اسیمفاده‌از‌دعییار‌فاصیله‌وزن‌‌‌‌‌‌‌[95] عنوان‌دثال‌ی ‌پ داز ‌سطح‌پیکسیل ‌‌

Hausdorffدر‌.‌تطبیق‌دهیر‌ نری‌شره‌از‌سنر‌قطعهکلمات‌کانریرا‌کلمه‌دورد‌نظ ‌کار ‌را‌ ا‌تصاوی ‌‌4

کلمه‌اسمخ اج‌‌همسایه‌در‌ه دوی‌تصوی ‌کلمه‌دوردنظ ‌و‌تصاوی ‌ح وفپ داز ‌فضای‌ ین‌طول‌پیش

رونره‌و‌ناحیه‌دییان ‌تقسییم‌‌‌های‌ الارونره،‌پایینسپس‌تصاوی ‌کلمه‌ ه‌قسمت.‌شره‌از‌سنر‌حذف‌شر

دار‌ ی ای‌‌وزن‌Hausdorff عر‌از‌آن‌یی ‌فاصیله‌‌‌.‌دشود و‌وزنسای‌دخملف ‌ ه‌آنسا‌اخمصاص‌داده‌‌هشر

از‌یی ‌‌در‌صورتیکه‌این‌فاصله‌‌.رودد لب‌و‌تصاوی ‌کلمات‌کانریر‌ کار‌گی ی‌فاصله‌ ین‌تصوی ‌قاانرازه

1 Scott and Longuet-Higgins (SLH) 2 Weighted Hausdorff Distance(WHD)

Page 45: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

47

‌.‌شیود‌ی‌پ سشی ‌در‌سینر‌دشیخص‌دی ‌‌‌‌ی‌کلمهی‌کانریر‌ عنوان‌نمونهتصوی ‌کلمه‌م ‌ اشرکمآسمانه‌

‌.ه‌استاین‌رو ‌ ه‌نمایج‌دناسب ‌روی‌اسناد‌چاپ ‌چین ‌و‌لاتین‌دست‌یافم

مبتنی بر یادگیری هایروش 2-9-2

(‌BOVW)0کلمیات‌‌ صی ی‌‌ی ‌درل‌رایج‌در‌ ازیا ‌اطلاعات‌ ای‌ ازنمای ‌اسناد‌رهیافیت‌کییف‌‌

در‌ا مرا‌تعیراد‌خاصی ‌‌‌:‌شودرهیافت‌کیف‌ ص ی‌کلمات‌سه‌د حله‌اصل ‌را‌شادل‌د .‌[59،‌97]‌است

.‌شیود‌از‌تصیوی ‌اسیمخ اج‌دی ‌‌‌‌دهنره‌دناسیب‌دحل ‌ طور‌اتوداتی ‌ وسیله‌ی ‌تشخیص‌نقاط‌کلیری

نقاط‌ جسمه‌تصوی ‌هسمنر‌که‌دحموای‌اطلاعات ‌زیادی‌دارنر‌از‌این و‌ ای‌توصیف‌کیل‌‌‌،نقاط‌کلیری

گ هیای‌دشیا ه‌ یه‌یی ‌‌‌‌‌ نری‌شره‌و‌توصیفدر‌د حله‌دوم‌نقاط‌کلیری،‌خوشه.‌تصوی ‌دناسب‌هسمنر

از‌‌،اسیت‌کیه‌یی ‌نمیایش‌‌‌‌‌4 ی صی‌‌ییی ‌کلمیه‌‌ ا‌ه ‌خوشه‌دمناظ ‌.‌شونرخوشه‌اخمصاص‌داده‌د

دجموعیه‌خوشیه‌‌‌.‌گ های‌دمعلق‌ ه‌این‌خوشه‌اسیت‌ویژگیسای‌ ه‌اشم اک‌گذاشمه‌شره‌توسط‌توصیف

آخی ‌هی ‌تصیوی ‌ وسییله‌یی ‌ ی دار‌‌‌‌‌‌‌‌یدر‌د حله‌.توانر‌ عنوان‌ی ‌ف هنگ‌لغت‌ ص ی‌تفسی ‌شودد

نقطیه‌ایین‌رهیافیت‌‌‌‌‌تی ین‌دسیم‌‌.رخرادهای‌ه ‌کلمه‌ ص ی‌در‌تصوی ‌توصیف‌شره‌اسیت‌تعراد‌شادل‌

نیری،‌‌دورد‌رو ‌خوشه‌در.‌است(‌ای‌یا‌نقاط‌گوشهSIFT عنوان‌دثال‌)دحل ‌‌کلیریتشخیص‌نقاط‌

Kدیییانگین،‌الگییوریمم‌‌Kو‌داشییین‌ یی دار‌‌9نزدیکمیی ین‌همسییایه‌و‌آنییالیز‌دعنییای ‌نسفمییه‌آدییاری‌‌‌

.[90]‌ها‌هسمنررو دشسورت ین‌‌(SVM)5پشمیبان

هیای‌هنیری‌اسیمفاده‌کی ده‌‌‌‌‌از‌همین‌رو ‌ ای‌ ازیا ‌اسناد‌تصوی ی‌روی‌نوشمه‌[92]تحقیق‌

یکی ‌‌ . اشنرد ‌SIFTهای‌دورد‌اسمفاده‌دیانگین‌و‌ویژگ ‌k نری‌دورد‌اسمفاده‌الگوریمم‌خوشه.‌است

در‌دورد‌اسناد‌تصوی ی‌در‌نظ ‌نگ فمن‌دوقعیت‌دکان ‌کلمات‌ صی ی‌‌ BOVWهای‌رو ‌از‌دحرودیت

1 Bag Of Visual Words (BOW)

2 Visual Word

3 Probabilistic Latent Semantic Analysis (pLSA)

4 Support Vector Machine (SVM)

Page 46: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

40

ای‌حل‌این‌دسیاله،‌در‌تحقییق‌‌‌.‌شود اشر‌ ه‌عبارت‌دیگ ‌ت تیب‌کلمات‌ ص ی‌در‌نظ ‌گ فمه‌نم د

ی‌پ سش ‌ ای‌ه ‌کلمه‌سپس‌.شودد ها‌ ه‌سه‌ناحیه‌تقسیم‌ ‌تصوی ‌کلمه‌در‌راسمای‌سمونه‌[92]

ی ای‌‌.‌شیود‌ ا‌تمام‌نواح ‌اول‌کلمات‌دوجود‌در‌پایگاه‌داده‌دحاسبه‌د ‌،ی‌اول‌آندیزان‌انطبا ‌ناحیه

کیل‌‌‌ی‌پ سش ‌دجموع‌دیزان‌انطبیا ‌روی‌ ای‌ه ‌کلمه.‌نواح ‌دوم‌و‌سوم‌هم‌ ه‌همین‌صورت‌است

ه‌ازای‌ه ‌تصوی ‌.‌شودد ا‌تصاوی ‌کلمات‌دوجود‌در‌پایگاه‌داده‌در‌نظ ‌گ فمه‌‌،تصوی ‌و‌ه ‌سه‌ناحیه

ی‌کلمیه‌پ سشی ‌آشیکار‌‌‌‌دوجود‌در‌پایگاه‌داده‌که‌دیزان‌انطبا ‌ یشم ‌ اشر‌آن‌تصوی ‌ ه‌عنوان‌نمونه

نیوع‌ز یان‌دخملیف‌‌‌‌‌‌5تصیوی ‌کلمیه‌در‌‌‌011111ی‌ زرگی ‌شیادل‌‌‌این‌رو ‌روی‌پایگاه‌داده.‌شودد

شیکل‌‌شیمای‌کلی ‌ایین‌رو ‌در‌‌‌‌‌.حاصل‌شره‌اسیت‌%‌‌75هنری‌ارزیا ‌شره‌است‌که‌دقت‌ یش‌از‌

‌.دشخص‌شره‌است‌‌4-05

‌BOVW [92] ازیا ‌اسناد‌تصوی ی‌هنری‌ ا‌رو ‌‌:05-‌4شکل‌

‌پ وجکشن‌‌های‌ساخماری‌داننردار‌و‌ویژگ از‌ویژگ ‌گ ادیان‌جست، [51]تحقیق‌ پ وفایل‌ الا،

‌دمون‌دست ‌افق ‌ ای‌جسمجوی‌کلمات‌در ‌استنوشمهعمودی‌و ‌ک ده ‌اسمفاده ‌ی‌اردو رو ‌ارائه‌.

ا‌.‌ اشرهای‌دمصل‌اصل ‌ه ‌خط‌د شره‌در‌این‌تحقیق‌دبمن ‌ ‌جراسازی‌خطوط‌و‌اسمخ اج‌دولفه

های‌دمصل‌نزدی ‌ ه‌هم،‌فهچسارتای ‌از‌دولی ‌تا‌های‌ح کت‌ی ‌پنج ه‌لغزان‌روی‌ه ‌خط،‌ت کیب

‌دجموعه ‌عنوان ‌د ‌ ه ‌ایجاد ‌سنر ‌کانریر ‌توسط‌‌.شونرکلمات ‌شره ‌ایجاد ‌کانریر ‌کلمات دجموعه

ی‌اردو‌ ه‌طور‌دؤث ی‌‌سیسمم‌ ازشناس ‌کلمه .نشان‌داده‌شره‌است‌05-‌4شکل‌‌ی‌لغزان‌درپنج ه

نری‌،‌ ای‌کلاسSVM نر‌از‌طبقه .رود نری‌کلمات‌کانریر‌شره‌ ه‌کار‌د ‌ط اح ‌شره‌و‌ ای‌رده

Page 47: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

42

انجام‌تاییر‌یا‌عرم‌تاییر‌‌دنظور‌افزایش‌کارای ‌سیسمم،‌ی ‌د حله‌ ه‌.است‌این‌دجموعه‌اسمفاده‌شره

‌شودد .‌ ‌این‌د حله ‌واقع ‌نبودندر ‌یا ‌ ای‌کلمات‌‌ ای‌تشخیص‌درست‌ ودن کلاس‌ رست‌آدره

‌:شونردوارد‌زی ‌ رس ‌د در‌این‌د حله‌.‌است‌SVMهای‌کانریر‌ ا‌توجه‌ ه‌خ وج

ی‌اقلیرس ‌ ین‌فاصله(5های‌سیاه‌تعراد‌پیکسل(9نقاط‌تعراد‌(SVM 0 احممال‌ الا‌خ وج (0

‌ ا‌دیانگین‌کلاس‌دورد‌نظ ‌‌ی‌کانریرکلمه‌ دار‌ویژگ

گیزار ‌شیره‌‌‌‌%00/24 نیری‌صیحیح‌‌‌و‌ن خ‌قطعیه‌‌%0/71،‌ف اخوان ‌%75/51در‌این‌رو ‌دقت‌

‌.است

‌[51]‌ی‌لغزاندجموعه‌کلمات‌کانریر‌ایجاد‌شره‌توسط‌پنج ه‌:05-‌4شکل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

هیای‌‌ ی ‌پاییه‌دیرل‌‌‌‌نوشیمه‌دسیت‌‌دمونرو ‌جریری‌ ای‌تشخیص‌کلمات‌در‌‌[50]تحقیق‌در‌

سازی‌هی ‌‌و‌ ای‌شبیه‌یافمهآدوز ‌‌، ا‌ح وفها،‌ HMMدر‌این‌تحقیق‌.‌شره‌است‌دخف ‌دارکو‌ارائه

-ای‌ارائه‌ سم ‌تصاوی ‌نواح ‌کلمیات‌غیی ‌‌ فیلم ‌های‌لاز‌در‌و‌شونرد ا‌هم‌ت کیب‌ی‌پ سش ‌کلمه

سییاری‌ یرون‌نییاز‌ یه‌‌‌‌‌‌کلمیات‌ ی ای‌‌دارد‌که‌‌را‌قا لیتاین‌سیسمم‌این‌.‌است‌شرهاسمفاده‌‌پ سش

،‌ع ی ‌و‌‌های‌دخملفی ‌از‌جملیه‌انگلیسی ‌‌‌و‌ح وف‌عمل‌کنر‌و‌قا ل‌اعمال‌ ه‌ز ان‌کلمات نری‌قطعه

AMA ای‌انگلیسی ،‌ ‌IAMشادلهای‌دخملف‌از‌ز انداده‌‌هایپایگاهسیسمم‌ ‌روی‌.‌دوانگاری‌است

هیای‌لغ انی ‌ یه‌نیام‌‌‌‌‌دمن،‌پنج هروی‌ه ‌خط‌‌.ارزیا ‌شره‌است‌0 ای‌دوانگاری‌LAW ای‌ع ‌و‌

.‌ اشینر‌پوشان ‌دی ‌هم%‌‌05پیکسل‌است‌و‌دارای‌‌41ها‌طول‌این‌ف یم.‌ف یم‌در‌نظ ‌گ فمه‌شره‌است

1 Devanagari‌

Page 48: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

91

هی ‌فی یم‌ ی ‌دبنیای‌د کیز‌‌‌‌‌‌.‌شیونر‌اسمخ اج‌دی ‌‌0گ ادیان‌و‌سطح‌روشنای های‌ ای‌ه ‌ف یم‌ویژگ

جسیت‌‌‌0هیای‌گ ادییان‌در‌‌‌ویژگی ‌‌ لیوک‌ نیری‌شیره‌و‌ ی ای‌هی ‌‌‌‌‌دو‌ لوک‌ناحیه ه‌های‌قلم‌پیکسل

ایین‌‌‌ناحیه‌تقسییم‌شیره‌و‌‌‌5های‌سطح‌روشنای ‌ه ‌ لوک‌ ه‌ ای‌اسمخ اج‌ویژگ .‌شونراسمخ اج‌د

نشان‌07-‌4شکل‌ها‌در‌این‌ویژگ ‌.آیرهای‌سیاه‌ ه‌سفیر‌ رست‌د کسل ا‌شمار ‌تغیی ات‌پی‌ویژگ

‌.انرداده‌شره

]50[دار‌و‌سطح‌روشنای ‌تحقیق‌های‌گ ادیان‌جستاسمخ اج‌ویژگ :‌07-‌4شکل‌

‌فارس ‌[54]‌در ‌ ای‌اسناد ‌استع ‌/ی ‌رو ‌ ازیا ‌شره ‌تشخیص‌ارائه ‌از این‌‌.دسمقل

-دمر‌شادل‌پیش.‌توانر‌دورد‌اسمفاده‌ق ار‌گی دع ‌و‌انگلیس ‌د /سیسمم‌در‌دمون‌ت کیب ‌فارس

ح وف‌ ا‌‌های‌زی ح وف،‌تفسی ‌زی زی کلمه،‌تشخیص‌و‌حذف‌دمصل‌کننرهپ داز ،‌اسمخ اج‌کلمه‌و‌

ای‌تشخیص‌‌RBF نری‌زی ح وف‌ ا‌اسمفاده‌از‌درخت‌تصمیم‌و‌شبکه‌عصب ‌کرگذاری‌شکل،‌رده

سیسمم‌اسناد‌تصوی ی‌را‌ ا‌ی ‌شمای‌جریر‌کرگذاری‌شکل‌زی ح وف‌در‌اسناد‌‌این‌.زی ح ف‌است

‌کنرع ‌ ازیا ‌د /فارس ‌از‌ نر‌دبمن ‌ ‌درخت‌تصمیمدهر. ‌اسمفاده ‌ ا گی ی‌فضای‌زی کلمات‌را

ویژگیسای‌شکل‌دکان ‌شادل‌طول،‌ع ض،‌.‌کنرویژگیسای‌شکل‌دکان ‌ ه‌تعرادی‌زی ناحیه‌تقسیم‌د

‌گودالحف ه ‌سوراخها، ‌دنرانهها، ‌و‌زی ح وف‌ الارونره‌و‌پایینها، در‌روشسای‌دبمن ‌ ‌‌.رونره‌استها

‌پیوسمه،‌ نری‌قطعه ‌نوشمار ‌ ای‌فارس ‌و ‌خصوصا ‌انرازه، ‌تنوع‌فونت‌و ‌نویز، ‌ ‌دسائل ‌داننر علاوه

‌ نری‌نیز‌وجود‌دارددشکل‌قطعه نری‌علت‌تنوع‌شکل،‌انرازه‌و‌طول‌ح وف،‌تخمین‌نقاط‌قطعهه‌ .

1 intesity

Page 49: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

90

‌.شان‌داده‌شره‌استن‌00-‌4شکل‌د احل‌این‌رو ‌در‌‌.شودح وف‌پ ‌اشمباه‌انجام‌د

‌[54]‌د احل‌رو ‌تحقیق:‌00-‌4شکل‌

ی پرسشینوع کلمهبندی براساس تقسیم 2-1

‌یصیورت‌کلمیه‌‌‌‌پ سش ‌را‌ یه‌‌یاکث اً‌کلمه‌،کلمه‌یجسمجو‌یزدینه‌شره‌در‌در‌تحقیقات‌انجام‌

شره‌اسیت‌‌‌‌گی نر‌که‌در‌ یشم ‌دوارد‌از‌خود‌سنر‌اصل ‌دورد‌جسمجو‌ یرهنظ ‌د ‌در‌(QBE)تصوی ی

صیورت‌دمنی ‌‌‌‌‌را‌در‌کادر‌د وط‌ ه‌انر‌که‌کار ‌آندر‌نظ ‌گ فمه(‌QBT)صورت‌دمن‌‌‌ هو‌ خ ‌آن‌را‌

Page 50: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

94

‌.نمایروارد‌د

‌ ‌دست جسمجویرونر ‌صورت‌نوشمهکلمات ‌ی ‌دد ‌ QBE ه ‌صورت ‌ ه ‌کلاسی ‌توانر سئله

‌داده‌پایگاهای‌از‌تصاوی ‌کانریرا‌در‌ ا‌دجموعه‌ی‌پ سش تصوی ‌کلمه.‌ نری‌شود ازیا ‌تصوی ‌ف دول

ت ‌تمام‌کانریرها‌را‌ ا‌توجه‌ ه‌گ دانر‌یا‌ صورت‌کل د ت ین‌تصاوی ‌را‌ دقایسه‌شره‌و‌سیسمم‌شبیه

‌ جمله‌دعایب‌دسم‌این‌‌از‌.کنر نری‌د صورت‌نزول ‌رتبهی‌پ سش ‌کلمهدیزان‌شباهت‌ ه‌تصوی

نمونه‌از‌کلمه‌دورد‌جسمجو‌و‌دشخص‌کار ‌ ای‌یافمن‌ی ‌‌توان‌ ه‌این‌دسئله‌اشاره‌ک د‌کهرو ‌د

‌ ه ‌سنر‌را ‌آن، ‌دهر‌‌ک دن‌دحروده ‌ق ار ‌دولفه‌‌.صورت‌دسم ‌دورد‌جسمجو ‌‌QBEسیسممدسم‌دو

‌. اشرد (‌گ هادعیار‌شباهت‌ ین‌توصیف)و‌انطبا ‌(‌گ تصوی ‌توصیف)‌نمایش

مجو‌ورودی‌رشمه‌دمنی ‌اسیت‌کیه‌ اییر‌جسی‌‌‌‌‌‌QBTچ ا‌که‌در‌‌استدممایز‌‌‌QBTاز‌این‌دسئله‌

‌QBTهیای‌‌از‌ط فی ‌سیسیمم‌‌‌.‌دزایای‌خودشان‌را‌دارنیر‌‌QBEو‌‌QBTه ‌ی ‌از‌سیسمم‌های‌‌.شود

ییا‌‌‌ی‌کلییری‌کلمیه‌هی ‌‌‌یجسمجودر‌پذی ی‌های‌شناسای ‌دسمخط‌دثل‌انعطافتمام‌دزایای‌سیسمم

‌ طور‌خاص‌ ای‌دیواردی‌ QBE .دار‌در‌دسم س‌را‌دارنر‌چسبهای‌ ادکان‌اسمفاده‌از‌حجم‌زیاد‌داده

ط ف‌دیگی ‌‌‌از .آینر‌دناسب‌استدر‌دسم س‌نیسمنر‌یا‌ ا‌هزینه‌ الا‌ رست‌د ‌دارهای‌ چسبکه‌داده

تصوی ی‌دنحص اً‌ ‌اسیاس‌تطبییق‌تصیوی ‌‌‌‌‌های‌کلمه‌پ سش دهر‌که‌رهیافتنشان‌د ‌[59]‌تحقیق

توانر‌دقت‌کیاف ‌دوردنییاز‌سیناریوهای‌عملی ‌را‌ یه‌‌‌‌‌‌د و‌است‌یعن ‌فاز‌آدوز ‌ ا‌نظارت‌را‌نیاز‌نرارد‌

ازییا ‌‌)های‌دبمن ‌ ‌کلمه‌پ سش ‌دمن ‌‌رود‌که‌رو ا‌توجه‌ ه‌دقایسه‌فو ‌انمظار‌د ‌.دست‌آورد

سمی ی‌داشیمه‌‌‌‌ها‌و‌نوشمارهای‌دخملف‌از‌کلمه‌ورودی،‌ف اخیوان ‌‌ف متوجه‌ ه‌توانای ‌ ازیا ‌‌ ا(‌کلمه

‌.هسمنر‌ یان‌خواهنر‌شر QBTو‌‌QBEدر‌اداده‌تعرادی‌از‌تحقیقات‌که‌شادل‌ه ‌دو‌رو ‌‌. اشر

‌ ازشناسی ‌ی‌اسیناد‌تصیوی ی‌و‌‌‌‌ ه‌عنوان‌روش ‌در‌حوزه‌0ها‌دشخصه‌تعبیهرو ‌از‌‌[55]‌تحقیق

در‌ایین‌تحقییق‌‌‌‌.دسیت‌یافمیه‌اسیت‌‌‌‌لاتینکه‌ ه‌نمایج‌دناسب ‌در‌ز ان‌‌نمودهکلیری‌اسمفاده‌‌‌کلمات

1 Attribute

Page 51: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

99

‌ی ی ای‌هی ‌کلمیه‌‌‌در‌ایین‌رو ‌‌.‌توانیر‌ اشیر‌‌صورت‌دمن‌یا‌تصیوی ‌دی ‌‌‌دوکلمه‌دورد‌جسمجو‌ ه‌ه ‌

‌انیر‌شیره‌‌تعبییه‌د وط‌ ه‌آن‌در‌ی ‌فضای‌ داری‌دشم ک‌‌0ی‌دمن ‌تصوی ‌آن‌کلمه‌و‌رشمه،‌پ سش

زدی ‌ ه‌یکریگ نر‌و‌ی‌کلمه‌پ سش ‌یکسان‌هسمنر‌ن‌دهنره‌ی‌که‌نشان‌ا‌وی ‌و‌رشمهاکه‌در‌این‌فضا‌تص

‌‌.ت ین‌همسایگ ‌انجام‌شود‌ ه‌صورت‌دسئله‌نزدی ‌ ازشناس دهر‌که‌عملیات‌‌این‌اجازه‌را‌د

های‌دمن ‌دمناظ ‌ ا‌آنسا‌دع ف ‌شیره‌‌در‌این‌تحقیق‌ی ‌نمایش‌رایج‌ ای‌تصاوی ‌کلمات‌و‌رشمه

عر‌نشان‌که‌ه ‌ ُ‌شودد ‌ساخمهی ‌هیسموگ ام‌ این ی‌از‌ح وف‌،‌های‌دمن ازنمای ‌رشمه ای‌‌.است

یین‌کلمیات ‌کیه‌دارای‌‌‌‌ ای‌ایجاد‌تمایز‌.‌ح ف‌خاص ‌را‌در‌خود‌دارد‌یا‌نه‌ دمنی‌‌د ‌دهر‌آیا‌رشمه

هسمنر‌از‌رو ‌ه د ‌اسمفاده‌شره‌که‌ یه‌جیای‌پییراک دن‌حی وف‌در‌کیل‌کلمیه‌روی‌‌‌‌‌‌‌ح وف‌دشا ه‌

عنیوان‌دنبیع‌اصیل ‌‌‌‌‌‌ یه‌(‌PHOC)‌4هیسموگ ام‌ه دی ‌حی وف‌‌‌.استک ده‌نواح ‌دخملف‌کلمه‌تم کز‌

‌‌.شره‌استاسمفاده‌‌فیش از‌ دارهای‌‌هم‌تصاوی ‌ ای‌نمایش‌.شودد اسمفاده‌‌دشخصه

‌SVMپایه‌‌های‌دشخصه‌ ‌ل‌دوز ‌درآ ای‌‌PHOCهای‌‌ چسب‌هم اه‌ ه‌این‌ دارهای‌ویژگ

از‌کلمیه‌را‌دع فی ‌‌‌ی ‌ ازنمای ‌ ا‌طول‌ثا ت‌و‌ا عاد‌کیم‌‌ ه‌عبارت‌دیگ ‌این‌تحقیق‌‌.شونر‌اسمفاده‌د

دشیم ک‌‌ ی داری‌‌که‌این‌ ازنمای ‌دنج ‌ ه‌ی ‌فضای‌‌‌نحوی‌‌دحاسبه‌است‌ ه‌‌س عت‌قا ل‌‌ک ده‌که‌ ه

‌9کیانون ‌گ دد‌و‌از‌ی ‌رو ‌کالیب ه‌ک دن‌ ه‌نام‌آنالیز‌همبسمگ ‌ ین‌ ازنمای ‌تصوی ‌و‌دمن‌کلمه‌د

(CCA‌) ایین‌تحقییق‌‌‌.‌ح‌ سم ‌نمایج‌شره‌استها‌ س ه‌ ده‌که‌دنج ‌ ه‌اصلا‌ ای‌تصحیح‌دقادی ‌ویژگ

ای‌است‌که‌در‌ف هنگ‌لغیت‌‌ ‌روی‌تصاوی ‌کلمات‌ یره‌شره‌انجام‌شره‌و‌هرف‌آن‌دسمیا ‌ ه‌نمونه

رو ‌توانیای ‌‌ایین‌‌یک ‌از‌دوارد‌جالب‌این‌است‌کیه‌‌.‌ی‌دورد‌پ سش‌را‌دارد یشم ین‌شباهت‌ ه‌کلمه

‌. ازشناس ‌کلمات‌دیره‌نشره‌را‌نیز‌تا‌حری‌داراست

1 Text strings

2 Pyramidal Histogram Of Characters(PHOC)‌

3 Canonical Correlation Analysis (CCA)

Page 52: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

95

ست‌که‌این‌ ازنمیای ‌‌پیشنساد‌شره‌ا [55]روش ‌ ‌اساس‌تعبیه‌ک دن‌رشمه‌در‌ز ان‌انگلیس ‌در‌

‌هیرف‌ایین‌‌.‌ها‌اسیمفاده‌شیره‌اسیت‌‌‌عنوان‌دنبع ‌از‌دشخصه‌‌در‌ی ‌دفسوم‌تعبیه‌ک دن‌ چسب‌نه‌ ه

هیای‌‌کلمه‌وجود‌داشمه‌ اشر‌که‌دشخصیه‌‌ دمنی‌رشمه ای‌تصوی ‌و‌‌0 ازنمای ‌دشم کاست‌که‌ی ‌

گی نیر‌‌دشم ک‌ق ار‌د ‌شره‌از‌تصوی ‌در‌ی ‌زی فضای‌ ین ‌های‌پیشاسمخ اج‌شره‌از‌رشمه‌و‌دشخصه

‌.نمایش‌داده‌شره‌است‌02-‌4شکل‌‌شمای‌کل ‌این‌سیسمم‌در‌.تواننر‌دقایسه‌شونرو‌د

[55]شمای‌کل ‌سیسمم‌:‌02-‌4شکل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

‌.های‌لاتین،‌دوانگاری‌و‌ع ‌توصیف‌شره‌استدر‌نوشمه‌سیسمم ‌ ای‌تشخیص‌کلمه‌]04[در‌

.‌است‌اسمخ اج‌ویژگ (‌4) نری‌کلمه‌و‌خط‌قطعه(‌0)شادل‌‌تحقیقکلمه‌در‌این‌‌جسمجویرو ‌

فاصله‌ ین‌کلمات‌ عنوان‌ی ‌دسئله‌‌،و‌ ای‌جرا‌ک دن‌کلمات‌4 نریاز‌خوشه‌ ای‌جراک دن‌خطوط

از‌شبکه‌عصب ‌ ا‌‌.عمل‌شره‌است‌، نری‌که‌آیا‌این‌فاصله‌ ین‌دو‌کلمه‌است‌یا‌اجزای‌ی ‌کلمهرده

‌. نری‌اسمفاده‌شره‌استهای ‌از‌زی کلمات‌ ای‌این‌ردهویژگ

‌.اسیت‌‌(گ ادیان،‌سیاخماری‌و‌تعقی ‌‌)‌دبمن ‌ ‌گ ادیانهای‌دودوی ‌‌ویژگ ‌،های ‌ کار‌رفمهویژگ

‌0در‌‌5 نیری‌‌ها‌تحت‌ی ‌تقسیمویژگ .‌شودگی ی‌د که‌در‌دقیاسسای‌ زرگ،‌دموسط‌و‌دحل ‌انرازه

یت‌ویژگ ‌تعقی ‌‌‌455 یت‌ویژگ ‌ساخماری‌و‌‌905 یت‌ویژگ ‌گ ادیان،‌‌905اسمخ اج‌شره‌و‌شادل‌

1 Joint representation

2 Clustering

Page 53: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

95

هیای‌هنرسی ‌سیطح‌‌‌‌ویژگ ‌،گ ادیان‌.دهررا‌د ‌0145 دار‌ویژگ ‌دودوی ‌ ه‌طول‌‌ی ‌که؛‌ اشرد

هیای‌سیاخماری‌شیکل‌‌‌‌ویژگی ‌‌.دهرها‌و‌خطوط‌در‌جسات‌دخملف‌را‌نشان‌د دیانه،‌شادل‌وقوع‌گوشه

ها،‌خطوط‌قط ی،‌عمودی‌و‌افق ‌در‌تصیوی ‌گ ادییان‌‌‌وجود‌گوشه‌که‌دهرت ‌کلمه‌را‌نمایش‌د درشت

دشخصیات‌‌ی‌دهنیره‌نشیان‌ویژگی ‌تعقی ‌‌‌.‌دهرنشان‌د را‌‌[55]در‌قانون‌تعیین‌شره‌‌‌04 ا‌اسمفاده‌از

های‌افقی ‌ییا‌عمیودی‌ یزرگ‌‌‌‌‌ها‌و‌س کش،‌وجود‌حف ه0نماهاهنرس ‌و‌دکان ‌اصل ‌شادل‌جست‌طا

این‌دعیار،‌شباهت‌ یین‌دو‌‌‌.اسمفاده‌شره‌است‌4جست‌شناسای ‌کلمه‌از‌دعیار‌شباهت‌همبسمگ .است

.کنیر‌شیود‌دحاسیبه‌دی ‌‌‌ یاین ی‌نمیایش‌داده‌دی ‌‌‌ ی دار‌ویژگی ‌‌‌‌شکل‌آنسا‌توسطتصوی ‌کلمه‌را‌که‌

وی‌دمیون‌چیاپ ‌‌‌های ‌از‌ه ‌سه‌ز ان‌تست‌شره‌و‌ادعا‌شره‌که‌نمیایج‌ر‌داده‌رو ‌فو ‌روی‌دجموعه

ی ای‌‌‌.رسییره‌اسیت‌‌%‌‌01ی‌ع ی ‌ یه‌دقیت‌‌‌‌نوشمهق‌در‌دمون‌دستیاین‌تحق.‌ وده‌است سیار‌خوب‌

ع ‌دیورد‌جسیمجو‌را‌ یا‌حی وف‌انگلیسی ‌تاییپ‌کنیر‌و‌‌‌‌‌‌‌‌‌یتوانر‌کلمهکار ‌د ‌حالت‌پ سش‌ ا‌دمن

کی ده‌اسیت،‌‌‌‌گیذاری‌شیاخص‌تصیوی ی‌سینر‌را‌‌‌‌اساس‌ی ‌سیسمم‌ف هنگ‌لغت‌که‌لغات‌ ‌الگوریمم

.کنرد کلمات‌ع ‌دوردنظ ‌را‌پیرا‌

1 Bay

2 Correlation Similarity

Page 54: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

95

Page 55: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

97

9 ‌

:فصل سوم

مباحث نظری

Page 56: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

90

هیای‌ز یان‌فارسی ‌‌‌‌‌نوشمه‌ی ‌رهیافت‌جسمجوی‌کلمه‌ ای‌دستاین‌پایان‌ناده‌رو ‌پیشنسادی‌

ه‌همیین‌‌‌.شادل‌اسناد‌تصوی ی‌است‌است‌که‌هرف‌آن‌یافمن‌ی ‌کلمه‌پ سش ‌در‌ی ‌دجموعه‌داده

‌در‌ایین‌فصیل‌‌.‌]55[اسمفاده‌شره‌اسیت‌و‌همکارانش‌‌Almazanتوسط‌دنظور‌از‌رو ‌پیشنساد‌شره‌

همچنین‌ا میرا‌ یه‌‌‌‌. اشر‌ ه‌تفضیل‌ یان‌خواهر‌شرکه‌اساس‌این‌پایان‌ناده‌نیز‌د ‌]55[‌رو ‌تحقیق

تئوری‌دباحث‌اسمفاده‌شره‌در‌این‌رو ‌که‌شادل‌اسمخ اج‌ویژگ ‌از‌کلمات‌در‌سینر،‌تشیکیل‌ ی دار‌‌‌‌

‌.شوداست‌پ داخمه‌د ....‌فیش ‌‌و‌

SIFTهای استخراج ویژگی 9-4

از هرف.‌ اشرد ویژگ اسمخ اج د حله الگو، ازشناس هایسیسمم در د احل ت یندسم از یک

در توصیفگ ها ینا.‌ اشرد ‌تصوی ی یان ای دناسب هایتوصیفگ ک دن ف اهم ویژگ اسمخ اج

‌.رودد کار ه‌ ازشناس و نریکلاسه د حله در ویژگ دار ی قالب

اشینر‌و‌در‌‌‌هیای‌خیو ‌ ی ای‌توصییف‌آن‌‌‌‌اسمخ اج‌نقاط‌کلیری‌از‌تصوی ‌ی ‌ش ‌کیه‌نماینیره‌‌

های‌ زرگ‌در‌حیوزه‌‌شناس ‌دناسب ‌را‌تحقق‌ خشنر‌از‌چالشو‌ از‌نماهای‌دخملف‌دارای‌پایراری‌ وده

کالیب ه‌ک دن‌دور ین،‌ثبت‌تصاوی ،‌ناو ی‌ر ات‌و‌تشخیص‌اشیا‌تنسیا‌تعیرادی‌از‌‌‌.‌ ینای ‌داشین‌است

ه‌طور‌دثال‌در‌کار د‌ ازشناس ‌شئ،‌اسمفاده‌از‌این‌نقاط‌کلییری‌‌.‌ اشنرها‌د کار دهای‌این‌ویژگ

‌:سه‌د حله‌اصل ‌زی ‌انجام‌داد‌را‌دیموان‌ط

در‌‌که‌ف دی ه ا‌جسمجو‌ک دن‌در‌تصوی ‌و‌یافمن‌نقاط‌دنحص ‌د حلهاین‌‌:یافمن‌نقاط‌کلیری (0

ف د‌ اق ‌ ماننر،‌انجام‌های‌هنرس ‌صفحه‌و‌یا‌تغیی ‌روشنای ‌ ه‌عنوان‌نقاط‌دنحص هتبریل

.شودد

اشر‌که‌در‌دقا ل‌نویز‌دحیط،‌تغیی ات‌‌ایتوصیف‌این‌نقاط‌ ایر‌ ه‌گونه:‌توصیف‌نقاط‌کلیری (4

.حساس‌ اشنریکسان ‌را‌از‌نقاط‌کلیری‌داشمه‌و‌دممایز‌و‌غی ‌توصیفپ دازی،‌هنرس ‌و‌نور

عمودا‌در‌این‌د حله‌از‌.‌است‌شئ‌یا‌صحنه‌ی‌آخ ‌تطبیق‌این‌نقاط‌ ین‌تصاوی ‌دخملفد حله (9

Page 57: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

92

ی‌قبل‌ وجود‌آدرنر،‌اسمفاده‌د حلههای‌ویژگ ‌که‌در‌ی‌فاصله،‌دیان‌ دارهای‌دحاسبهرو

.شودد

‌دقایسه ‌رو در ‌دیان ‌که ‌ویژگ ای ‌توصیف ‌دخملف ‌استهای ‌شره ‌انجام ‌ ارزت ین‌‌SIFT؛ها ،

وچ خش،‌ زرگنمای ‌‌تغیی ‌دقیاس، ه نسبت هاویژگ این .[57]توصیف‌را‌از‌ش ‌ارائه‌داده‌است

‌ .[50] اشنرثا ت‌د ،نویز وروشنای ‌ تغیی ات ه نسبت حرودی تا همچنین

‌ ‌ وسیله‌SIFTالگوریمم ‌‌David Loweی ‌سال ‌گ دیر‌0222در ‌ ای‌ SIFT .ا راع ی ‌رو

یا ‌توانر‌ ای‌تناظ اشر‌که‌د های‌دسمقل‌و‌دشخص‌از‌تصاوی ‌د آشکارسازی‌و‌اسمخ اج‌ویژگ

های ‌نظی ‌غالبا‌ ای‌کار د SIFTالگوریمم‌.‌و‌یا‌شئ‌ ا‌ی ‌تصوی ‌دورد‌اسمفاده‌ق ار‌گی د ین‌تصاوی ‌

های‌اطلاعات ‌ عری،‌ ازیا ‌شئ‌در‌ ان تصاوی ،‌ردیا ‌و‌ساخمن‌دنظ ‌سهیا ‌تشخیص‌شئ،‌تناظ

‌.]52 [ گی ددورد‌اسمفاده‌ق ار‌د .....‌های‌خودکار‌دحل ‌و‌،‌ر ات(دولم ‌دریا)ای‌چنر‌رسانه

که‌در‌سه‌د حله‌‌SIFTهای‌در‌اداده‌ ه‌طور‌اجمال ‌د احل‌اصل ‌آشکار‌ک دن‌و‌اسمخ اج‌ویژگ

‌.[51]گ ددارائه‌د شود‌خلاصه‌د

یافتن نقاط کلیدی 9-4-4

‌ ‌کلیری، ‌نقاط ‌د اصل یافمن ‌رو ‌این ‌در ‌د حله ‌ه م‌ت ین ‌دفاهیم ‌از ‌اسمفاده ‌ ا ‌که اشر

وضوح‌دخملف‌‌ر‌درجهله‌ه م‌تصوی ی‌ی ‌تصوی ‌د وسی .پذی دانجام‌د ‌4و‌فضای‌دقیاس‌0تصوی ی

های‌دخملف‌ساخمه‌ ا‌توجه‌ ه‌دفسوم‌فضای‌دقیاس‌که‌در‌آن‌تصوی ‌در‌دقیاس‌.شودنمایش‌داده‌د

سپس‌ ای‌ه ‌‌.تشکیل‌داد‌ا مرا‌تصوی ‌را‌در‌چنر‌دقیاس‌دخملف‌0-‌9شکل‌دیموان‌دطا ق‌‌شودد

‌ ‌تصوی ‌پنج ‌9اکماو)دقیاس‌تصوی ی، ‌تعراد‌( ‌ ه ‌نمیجه ‌در ‌که ‌آورد ‌ وجود ‌دخملف ‌دعیار ‌انح اف ا

‌دارد‌تصوی ی‌پنج‌هایدسمه‌دخملف‌هایدقیاس ‌دعیارهای‌انح اف‌ ا‌تای ‌پنج‌هایدسمه .وجود

1 Image Pyramid

2 Scale Space

3 Octave

Page 58: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

51

‌.انرآدره‌ وجود‌اصل ‌تصوی ‌در‌گوسین‌ک نل‌ض ب‌و‌فیلم گوسین‌توسط‌دخملف

‌پنج‌هایدسمه‌داخل‌در‌دجاور‌تصوی دو‌‌ه ‌گ دد،د ‌دلاحظه‌0-‌9شکل‌‌در‌که‌گونههمان‌سپس

‌اخملاف‌فیلم ‌اساس ‌جریر‌تصاوی ‌و‌ک ده‌کم‌هم‌از‌دات یس ‌جب ‌اساس ‌تفاضل ‌اخملاف‌ ا‌را‌تای

‌.‌شودد ‌ایجاد‌(DOG)تفاضل

تصوی ‌‌‌Iروا ط‌نای‌در‌.است‌شره‌آورده‌د حله‌این‌دعادلات‌حاکم‌ (‌9-9)تا‌(‌0-9)‌روا طدر‌

را‌تولیر‌‌ Lشره‌ن م‌تصوی ‌، (کانولوشن)تلفیق ‌ض ب‌ ا‌کهاست‌‌گوسین‌ک نل‌تا ع‌G اشر‌و‌اصل ‌د

‌نمایرد ‌که‌دجاور ‌تصوی ‌ ا‌تای ‌پنج‌دسمه‌ه ‌در‌‌Lیشره‌حاصل‌تصوی ‌دو‌تفاضل‌ ا‌سپس.

‌.گ ددد ‌ایجاد‌گوسین‌تفاضل اخملاف‌ اساس‌‌D اشر،‌تصوی د ‌σدعیار‌انح اف‌در‌آنسا‌اخملاف

(9-0)‌‌‌‌‌

(9-4)‌

(9-9)‌

‌انیرازه‌سیطح‌‌‌د حلیه‌‌ایین‌‌در.‌اسیت‌‌اکمیاو‌ هی ‌ در دینییمم‌ یا داکسیمم نقاط یافمن عر ید حله

‌در‌پیکسیل‌‌‌2 یا‌‌همچنیین‌‌و‌‌گی دد‌دی ‌‌دقایسیه‌‌آن‌دجیاور‌‌پیکسل‌‌0انرازه‌ ا‌پیکسل‌ه ‌خاکسم ی

ا‌هم‌اخملاف‌داشمنر‌و‌از‌تا ع‌اخیملاف‌گوسیین‌حاصیل‌‌‌‌‌σلحاظ‌‌از‌که) پایین ‌و‌ الای ‌دجاور‌تصاوی

‌ ود ‌ یه‌‌ یود‌‌کممی ‌‌ییا‌‌ یشم ‌همسایه‌پیکسل‌‌45تمام‌از‌پیکسل‌این‌دقرار‌اگ ‌گ ددد ‌دقایسه‌(شره

(4-‌9شکل‌.‌)شودکلیری‌گفمه‌د ‌نقطهآن‌‌ هشره‌و‌‌انمخاب‌کانریرویژگ ‌‌ی ‌عنوان

Page 59: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

50

‌DOG‌[51]ایجاد‌ه م‌ :0-‌9شکل‌

‌DOG[51] ها‌در‌ه مآشکارسازی‌اکسم دم:‌4-‌9شکل‌

اصلی نقطه هر مکانی موقعیت تعیین 9-4-2

دو سیپس‌‌.گ ددد ‌تعیین‌دخمصات‌لحاظ‌از‌نقطه‌اصل ‌ه ‌دوقعیت‌دقیق‌طور‌ ه‌د حله‌این‌در

:پذی د انجام‌د زی عمل

.شودحذف‌د ر،ندار پایین روشنای که ناپایرار نقاط (0

Page 60: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

54

.شونرد ناپایراری دوجب چ ا‌که گ ددد ‌حذف نیز هالبه ه د وط نقاط (4

تعییین‌‌‌(5-9)و‌‌(5-9)روا یط‌‌ ای‌ه ‌نقطه‌اصل ‌ ا‌توجه‌ ه‌‌ی‌گ ادیان‌و‌جست‌آنسپس‌دادنه

. گ ددد

(9-5)‌

(9-5)‌𝜃

توصیفگر نقاط کلیدی 9-4-9

اط اف در آن‌جست و گ ادیان یدادنها مرا‌ در.‌شر خواهر ایجاد اصل ویژگ دار د حله این در

در‌اط اف‌ه ‌‌05×05ی‌آزدایشات‌خود‌از‌ی ‌شبکهدر‌ [51]‌د جع.‌شود د دحاسبه‌ کلیری ینقطه

نری‌شره‌و‌از‌ه ‌ لوک‌تقسیم‌5×5های‌ی‌کلیری‌اسمفاده‌نموده‌است‌که‌این‌شبکه‌ ه‌ لوکنقطه

‌ ‌اسمخ اج‌د ‌0ی ‌هیسموگ ام ‌شودجسمه .‌ ‌ه ‌واقع‌در ‌ ای‌ه در ‌‌ لوک، ی‌دادنه‌هاجستی ‌از

‌د گ ادیان ‌جمع ‌هم ‌ ا ‌ویژگ ‌.شونرها ‌ دار ‌نقطه‌0×5×‌5=‌040 نا این‌طول ‌ ای‌ه ی‌عنص

چنر‌ و دحل طبیعت .دهرنشان‌د ‌4×4ی‌این‌د حله‌را‌ ه‌ازای‌آرایه‌9-‌9شکل‌.‌کلیری‌خواهر‌ ود

‌.سازدد حساس غی و‌انسراد، شلوغ نویز، ه نسبت را آنسا ها،ویژگ ودن دقیاس

[51]دار‌جست‌‌هیسموگ ام‌گ ادیان:‌9-‌9شکل‌

Page 61: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

59

بردار فیشر 9-2

ی دار‌‌.‌آییر‌های‌دحل ‌ رست‌دی ‌ دار‌فیش ‌ی ‌رو ‌ ازنمای ‌تصوی ‌است‌که‌از‌تجمیع‌ویژگ

‌.کنیر‌در‌نظ ‌گ فت‌که‌آدارهای‌د اتب‌ الات ‌را‌کر‌د ‌(BOW)رت‌کیف‌کلمات صو‌‌توان‌ هرا‌د فیش

سی عت‌دحاسیبات‌‌‌.‌شیونر‌های‌دحل ‌ ا‌ی ‌ دار‌در‌ا عاد‌ الات ‌کر‌د ا‌اسمفاده‌از‌این‌نمایش‌ویژگ

سیازی‌ یا‌حیراقل‌کیاهش‌دقیت‌از‌دزاییای‌‌‌‌‌‌‌ نرهای‌خط ،‌فشی ده‌کار‌ ا‌طبقه الا،‌عملک د‌دناسب‌در‌

.]45 [گ ددارائه‌د در‌ خش‌ عری‌رو ‌اسمخ اج‌ دارهای‌فیش ‌‌. دارهای‌فیش ‌است‌اسمفاده‌از

استخراج بردار فیشر تصاویر 9-2-4

عُیری‌اسیمخ اج‌شیره‌از‌یی ‌‌‌‌‌‌Dتوصیفگ ‌دحلی ‌‌‌T ه‌صورت‌‌‌ X={xt, t=1,….T}ی‌دجموعه

‌(تصوی ‌SIFT ه‌عنوان‌دثال‌دجموعه‌توصیفگ های‌.‌)شودتصوی ‌تع یف‌د

‌نسیبت‌ یه‌‌‌هیا‌داده‌0نمای درسیم‌‌گ ادیانی‌دحاسبهها‌ ا‌درل‌ک دن‌دادهی‌اصل ‌ دار‌فیش ‌ایره

:‌ها‌داریم ا‌ف ض‌اسمقلال‌نمونه.‌ اشرد (دیانگین‌و‌کوواریانس‌)‌پارادم های‌درل

(9-5)‌

-صورت‌دخلوط ‌از‌چگال ‌احممالاست‌که‌ ه‌‌xتوصیفگ ‌تا ع‌چگال ‌احممال‌ ‌Uλ الا یدر‌را طه

.((0-9)و(‌7-9)‌روا ط) انمخاب‌شره‌است‌(GMM)4های‌گوس

(9-7)‌

(9-0)‌

}‌

1 Gradient of the likelihood‌

Gaussian Mixture Model‌2

Page 62: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

55

‌μدخلیوط،‌‌توا ع‌گوس ‌در‌وزن‌‌w.‌است‌μk ,Ʃk ,k=1…K} λ={wk, صورت‌‌GMMپارادم های‌

ی ای‌‌.‌اسیت‌‌GMMهیا‌در‌هی ‌‌‌تعیراد‌گوسی ‌‌‌Kو‌هیا‌‌گوس (‌قط ی)کوواریانس‌Ʃها،‌گوس ‌دیانگین

روی‌تعیرادی‌زییادی‌از‌تصیاوی ‌آدیوز ‌‌‌‌‌‌GMM،‌ا میرا‌‌Xهای‌ رست‌آوردن‌ دار‌فیش ‌دجموعه‌داده

ی دار‌فیشی ‌‌‌‌GMM عیر‌از‌آدیوز ‌‌‌.‌شیونر‌دحاسیبه‌دی ‌‌‌EMدیره‌و‌پارادم های‌آن‌توسط‌الگوریمم‌

:آینر رست‌د ‌زی توسط‌روا ط‌امkُ ای‌گوس ‌Xی‌دجموعه

(9-2)‌

(9-01)‌

(9-00)‌

‌ ‌‌ و‌‌

عُری‌هسمنر‌و‌ دار‌فیش ‌نسای ‌ ا‌ت کیب‌این‌ دارها‌ ه‌ازای‌تمیام‌‌‌D دارهای‌‌

.شودها‌حاصل‌د گوس

(9-04)‌

Almazanروش پیشنهادی 9-9

کیه‌کلمیات‌‌‌‌دارنیر‌طیوری‌‌‌شیوه‌نگارش ‌کادلاً‌دمنیوع ‌نویس‌‌ون‌دستنویسنرگان‌دخملف‌در‌دم

شود‌کیه‌‌این‌تغیی ات‌زیاد‌در‌شیوه‌نگار ‌ اعث‌د .‌شونرتوانر‌کادلاً‌دمفاوت‌در‌نظ ‌گ فمه‌یکسان‌د

علیت‌ایین‌پیچییرگ ‌دو‌عادیل‌‌‌‌‌.‌ت ‌ اشیر‌ت ‌و‌سنگینهای‌دیگ ‌ سیار‌پیچیرهاین‌دسمه‌دسائل‌از‌گونه

ادا‌هرف‌این‌است‌که‌فقیط‌‌.‌دهنرهتشکیل‌شیوه‌نگار ‌و‌ح وف:‌تأثی گذار‌در‌تفاوت‌ ین‌کلمات‌است

‌.شیوه‌نگارش ‌تأثی ی‌نراشمه‌ اشر‌تفاوت‌ ین‌ح وف‌ اعث‌دمفاوت‌ ودن‌کلاس‌شود‌و‌تفاوت

Page 63: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

55

‌ایدشخصیه‌‌]55[‌تحقییق‌‌درو‌همکیارانش‌‌‌Almazanهمان‌طور‌که‌در‌فصل‌دوم‌نیز‌ یان‌شر‌

یا‌در‌نظی ‌گی فمن‌‌‌‌‌از‌همیین‌دشخصیه‌‌نادیه‌‌‌در‌این‌پایان.‌انرنموده ای‌کلمات‌در‌ز ان‌لاتین‌دع ف ‌

شیباهت‌ یین‌‌‌‌شود‌که اعث‌د گی ی‌این‌نوع‌دشخصه‌ ه‌کار.‌شودخصوصیات‌ز ان‌فارس ‌اسمفاده‌د

ای‌ارزییا ‌ایین‌الگیوریمم‌از‌دو‌پایگیاه‌داده‌فارسیا‌ ی ای‌‌‌‌‌‌‌.‌کلمات‌دسمقل‌از‌شیوه‌نگار ‌حفظ‌شود

ی ای‌آزدیون‌اسیمفاده‌شیره‌‌‌‌‌‌[50](FHT)0ی‌فارسی ‌دمن‌دست‌نوشیمه‌‌ی‌آدوز ‌و‌پایگاه‌دادهد حله

ی ای‌هی ‌کلمیه‌‌‌‌.‌ اشرنوشمه‌از‌کلمات‌دخملف‌د تصوی ‌دست09511ی‌فارسا‌شادل‌پایگاه‌داده.‌است

-تصیوی ‌دسیت‌‌‌0111شادل‌‌FHTی‌پایگاه‌داده‌.ردهای‌اف اد‌دخملف‌وجود‌دانوشمهنمونه‌از‌دست‌55

توانیر‌ یه‌دو‌صیورت‌‌‌‌در‌این‌رو ‌پ سش‌د ‌. اشردوضوع‌دخملف‌د ‌09ی‌فارس ‌از‌دمون،‌در‌نوشمه

ز یان‌فارسی ‌ یه‌تفضییل‌‌‌‌‌‌روی‌]55[در‌اداده‌د احل‌رو ‌تحقییق‌‌.‌ی‌دمن ‌کلمه‌ اشرتصوی ‌و‌رشمه

‌. یان‌خواهر‌شر

ها ی مشخصهنمایش کلمات بر پایه 9-9-4

‌خواص‌دعنای ‌هسمنر‌که‌د ‌دشخصه ‌اتواننر‌تص‌ها ‌و ‌توصیف‌کننر‌ها‌گ وهوی ‌ ای‌‌را ‌اخی ا و

‌ ازیا ‌تصاوی ‌وظایف‌کلاس ‌کسب‌نموده‌ نری‌و ‌کل ‌دشخصه‌.ران‌شس ت‌ف اوان ‌را ‌طور ‌این‌ ه ها

اسمفاده‌از‌‌.نرده نری‌اشیاء‌را‌د ‌دقایسه‌و‌دسمه‌‌ظ فیت‌را‌دارنر‌که‌ ه‌راحم ‌ ه‌دا‌اجازه‌توصیف،

‌روش ‌د دشخصه ‌ ه ‌دنج ‌دانش‌ ین‌کلاسها ‌از ‌که ‌د شود ‌ س ه ‌ دها ‌اشم اک. ‌واقع گذاری‌در

های‌ها‌یک ‌از‌رو اطلاعات‌ ین‌کلمات‌ ای‌یادگی ی‌دناسب‌ سیار‌دسم‌است‌و‌اسمفاده‌از‌دشخصه

‌.‌دسمیا ‌ ه‌این‌هرف‌است

‌کلمات‌از‌دشخصه ‌دادن ‌تمیز ‌ ه ‌قادر ‌که ‌تع یف‌شونر ‌صورت ‌ ه ‌تشخیص‌کلمات‌ ایر ‌در ها

‌نباشنر ‌وا سمه ‌نگار ‌نوع ‌ ه ‌همچنین ‌و ‌ اشنر ‌یگریگ ‌دشخصه. ‌این ‌از ‌یک ‌شره‌های پیشنساد

1 Farsi Handwritten Text(FHT)‌

Page 64: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

55

های‌دمن ‌د وط‌ ه‌کلمات‌در‌ ا‌اسمفاده‌از‌این‌رو ‌رشمه.‌است(‌PHOC)هیسموگ ام‌ه د ‌ح وف‌

های‌ورودی‌سیسمم‌در‌این‌د حله‌رشمه.‌شونراین ی‌ ه‌نام‌فضای‌ چسب‌تعبیه‌د داخل‌ی ‌فضای‌

‌.انرتایپ‌شره‌Notepadدمن ‌د وط‌ ه‌تصاوی ‌کلمات‌است‌که‌در‌داخل‌فایل‌

ا‌در‌نظی ‌گی فمن‌الفبیای‌فارسی ،‌‌‌‌‌.‌شودساخمه‌د ی ‌هیسموگ ام‌ این ی‌از‌ح وف‌در‌این‌رو ‌

ه ‌.‌شودخمم‌د " ی"ش وع‌و‌ ه‌‌"الف" عُر‌دارد‌که‌ ه‌ت تیب‌ح وف‌الفبای‌فارس ‌از‌‌94هیسموگ ام‌

در‌واقع‌اگ ‌کلمیه‌‌‌.ح ف‌خاص ‌را‌در‌خود‌دارد‌یا‌نه‌ دمنی‌‌آیا‌رشمه‌ی‌این‌است‌کهدهنرهعر‌نشان‌ ُ

‌آن‌در‌داخل‌هیسموگ ام‌ی ‌و‌در‌غیی ‌ایین‌صیورت‌صیف ‌‌‌‌شادل‌ی ‌ح ف‌خاص‌ ود‌در‌ عُر‌د وط‌ ه‌

‌.گی دق ار‌د

ی ای‌ایجیاد‌‌‌ ه‌همین‌دلییل‌‌.‌ای‌دارنرنمایش‌دشا ه‌"سلام"و‌‌"سالم"در‌این‌حالت‌کلمات ‌داننر‌

کی دن‌‌‌هسمنر‌از‌رو ‌ه د ‌اسمفاده‌شره‌که‌ ه‌جای‌پییرا‌ ین‌کلمات ‌که‌دارای‌ح وف‌دشا ه‌تمایز‌

در‌این‌رو ‌ ای‌هی ‌کلمیه‌سیطوح‌‌‌‌.‌است‌نمودهاح ‌دخملف‌کلمه‌تم کز‌ح وف‌در‌کل‌کلمه‌روی‌نو

کلمه‌ ه‌سیه‌ خیش‌و‌‌‌‌9در‌سطح‌‌،کلمه‌ ه‌دو‌ خش‌4در‌سطح‌.‌در‌نظ ‌گ فمه‌شره‌است‌5و‌‌4‌،9‌،5

یه‌‌.‌شیود‌در‌نظ ‌گ فمه‌دی ‌ عُر‌‌‌94ه ‌ خش ای‌.‌شود‌ ه‌همین‌ت تیب‌ ای‌سطوح‌ عری‌تقسیم‌د

های ‌ ه‌این‌صورت‌که‌آیا‌کلمه‌ی ‌ح ف‌خاص‌را‌در‌ خیش‌اول‌ییا‌در‌‌‌‌دشخصه‌4طور‌دثال‌در‌سطح‌

.‌گیی د‌‌ن‌ی ‌ق ار‌دی ‌آدر‌صورت‌وجود‌این‌دشخصه‌در‌ عُر‌د وط‌ ه‌.‌شونر‌ خش‌دوم‌دارد‌تع یف‌د

‌‌.ی‌کلمات‌هسمنر‌ها‌ ا‌این‌تع یف‌تمیز‌دهنره‌دشخصه

کیه‌هی ‌ عُیر‌یی ‌‌‌‌‌‌ ای‌ح وف‌اسیت‌‌ عُر( 5+5+9+‌4)×94=550دارای‌در‌نسایت‌این‌هیسموگ ام‌

ای‌ ه‌این‌صورت‌اسیت‌‌ طور‌دثال‌وجود‌ی ‌در‌ عُر‌اول‌این‌هیسموگ ام‌دع ف‌دشخصه.‌دشخصه‌است

‌.‌را‌در‌ خش‌اول‌خود‌داراست‌"الف"ای‌ صورت‌دو‌ خش ‌در‌نظ ‌گ فمه‌شود‌ح فکه‌اگ ‌کلمه

‌4در‌سیطح‌‌ای‌دو‌حی ف‌هسیمنر‌‌‌که‌ه ‌کیرام‌دار‌‌های‌فارس ‌ت ین‌ ایگ ام‌تا‌از‌رایج‌51در‌اداده‌

‌.شیود‌‌د ‌555دارای‌ا عاد‌این‌هیسموگ ام‌‌در‌نسایت عُر‌اضاف ‌‌415 ا‌اضافه‌شرن‌اضافه‌شره‌است‌که‌

Page 65: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

57

‌.دهر‌ان‌د نش‌"نیاز‌"ی‌هیسموگ ام‌ه د ‌را‌ ای‌کلمه‌5-‌9شکل‌

ی‌دورد‌نظ ‌ ه‌کرام‌ خش‌از‌ه م‌اخمصاص‌دارد‌از‌روا ط‌ ای‌تشخیص‌اینکه‌ه ‌ح ف‌از‌کلمه

(9-05)‌‌ ‌05-9)و ‌است( ‌شره ‌اسمفاده ‌گ فمن‌. ‌کلمه‌cدحل‌ق ار ‌اُدین‌ح ف‌در ‌طول ه‌‌mای‌ ه

‌توسط‌را طهصورت‌ ازه ‌05-9)ی‌ی‌دحاسبه‌شره ‌شودتع یف‌د ( ‌ ای‌ ازه. ‌نظ ‌گ فمه‌شره ی‌در

-9)ی‌سپس‌در‌صورت‌ ق اری‌را طه.‌شوددشخص‌د ‌هم‌توسط‌همین‌را طه‌lامُ‌در‌سطح‌r خش‌

05‌)‌،cاُدین‌ح ف‌ ه‌ خش‌‌ rدر‌سطح‌lاخمصاص‌دارد‌.

(9-05)‌

(9-05)‌

-b]|=b-a

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

‌9و‌0‌،4هیسموگ ام‌ه د ‌ح وف‌در‌سطوح‌ :5-‌9شکل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

پ‌‌ت‌‌ث‌‌ب‌‌الف‌‌‌‌ی‌‌ه‌‌و‌‌ن‌‌م‌‌‌‌‌‌‌‌‌‌‌‌‌‌ژ‌‌‌ز‌‌‌ر‌‌‌ذ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

او سطح

زنیا

سطح اول

ی ه و ن م ژ ز ر ذ پ ت ث ب الف ب الف

پ‌‌ت‌‌ث‌‌ب‌‌الف‌‌‌‌ه‌‌و‌‌ن‌‌م‌‌‌‌‌‌‌‌‌‌‌‌‌‌ژ‌‌‌ز‌‌‌ر‌‌‌ذ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

زنیا

سطح اول

یه و

ن م ژ ز

ر ذ پ ت ث ب

الف م

ی

ه و ن م

ژ ز ر ذ

پ ت ث ب

الف

او سطح

دوم سطح پ‌‌ت‌‌ث‌‌ب‌‌الف‌‌‌‌‌‌ژ‌‌‌ز‌‌‌ر‌‌‌ذ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ی‌‌‌ه‌‌و‌‌ن‌‌م‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

ی‌‌‌ه‌‌و‌‌ن‌‌م‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ژ‌‌‌ز‌‌‌ر‌‌‌ذ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌پ‌‌ت‌‌ث‌‌ب‌‌الف‌

نی

سطح اول

یه

و ن م

ژ ز ر ذ

پ ت ث ب

الف م

ی

ه و ن

م ژ ز ر

ذ

از

سطح اول

یه

و ن م

ژ ز ر ذ

پ ت ث ب

الف م

ی

ه و ن

م ژ ز

ی‌‌‌ه‌‌و‌‌ن‌‌م‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ژ‌‌‌ز‌‌‌ر‌‌‌ذ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌پ‌‌ت‌‌ث‌‌ب‌‌الف‌

ی‌‌‌ه‌‌و‌‌ن‌‌م‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ژ‌‌‌ز‌‌‌ر‌‌‌ذ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌پ‌‌ت‌‌ث‌‌ب‌‌الف‌

پ‌‌ت‌‌ث‌‌ب‌‌الف‌‌‌‌ی‌‌‌ه‌‌و‌‌ن‌‌م‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ژ‌‌‌ز‌‌‌ر‌‌‌ذ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

سوم سطح

ن

سط

ح او ل

ی ه و ن

م ژ ز ر

ذ پ

ت

یا

سط

ح او ل

ی ه و ن

م ژ ز ر

ذ

ز

سط

ح او ل

ی ه و ن

م ژ ز

Page 66: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

50

استخراج بردارهای فیشر 9-9-2

‌د حله ‌ی‌قبل‌رشمهدر ‌از ‌اسمفاده ‌ ا ‌فارسا ‌داده ‌پایگاه ‌تصاوی در‌‌PHOCهای‌دمن ‌د وط‌ ه

‌شره ‌انرفضای‌ چسب‌تعبیه ‌ عری‌ ای‌آدوز ‌دشخصه. ‌د حله ‌کلمات‌پایگاه‌در ‌تصاوی ‌ا مرا ها،

های‌سپس‌این‌ دارهای‌ویژگ ‌ ه‌هم اه‌ چسب.‌شونره‌ دارهای‌ویژگ ‌کرگذاری‌د ی‌فارسا‌ داده

PHOCاز‌ دارهای‌فیش ‌ ه‌عنوان‌نمایش‌پایه‌تصوی ‌.‌رونرها‌ ه‌کار‌د دمناظ ‌ ای‌آدوز ‌دشخصه‌

در‌اداده‌رو ‌اسمخ اج‌این‌.‌شونراسمفاده‌شره‌است‌و‌ دارهای‌ویژگ ‌ ای‌ه ‌تصوی ‌اسمخ اج‌د

‌.‌شود دارها‌ یان‌د

و‌ارتفاع‌‌wاگ ‌ع ض‌تصوی ‌.‌پ داز ‌استسازی‌ا عاد‌تصاوی ‌یک ‌از‌دسمم ین‌د احل‌پیشن دال

:تصوی ‌ ا ‌است‌ ا‌ اشر‌نسبت‌ا عاد‌hآن‌

(9-05)

ی‌پیکسل‌در‌نظ ‌گ فمه‌شره‌و‌ ا‌توجه‌ ه‌را طه‌01ارتفاع‌ ا ‌ ا‌در‌این‌حالت‌ ای‌تمام‌تصاوی ‌

‌.آیرطول‌جریر‌ه ‌تصوی ‌ رست‌د نسبت‌طول‌ ه‌ع ض،‌و‌ ا‌ف ض‌ثا ت‌دانرن‌(‌9-05)

‌0زدینیه‌های‌د وط‌ یه‌پیس‌‌‌ اشنر‌که‌پیکسلی‌فارسا،‌ صورت‌خاکسم ی‌د تصاوی ‌پایگاه‌داده‌

. اشینر‌ صورت‌خاکسیم ی‌دی ‌‌‌4د وط‌ ه‌کلمه‌یا‌پیش‌زدینههای‌دارای‌سطح‌ی ‌هسمنر‌و‌پیکسل

،‌ا مرا‌آنسا‌را‌ ه‌تصاوی ‌ این ی‌تبریل‌ک ده‌و‌سپس‌ یا‌اعمیال‌فیلمی ‌گوسی ‌دو یاره‌ یه‌‌‌‌‌‌‌ ای‌رفع‌نویز

‌.شونرتصاوی ‌خاکسم ی‌تبریل‌د

ی‌تصوی ‌ ه‌صورت‌تصادف ‌و‌غی ‌تک اری‌از‌تصاوی ‌پایگاه‌داده‌GMM‌،451 ای‌آدوز ‌درل‌

1 Background 2

Foreground

Page 67: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

52

‌انمخاب‌د ‌شونرفارسا ‌تبریل‌سپس‌توصیفگ . ‌تغیی دسمقل ویژگ های‌دم اکم ‌ه ‌‌0دقیاس از از

‌اسمخ اج‌د ‌شودتصوی ‌از. ‌‌SIFT ه‌جای‌‌ DSIFTدلیل‌اسمفاده ‌ص ف‌این‌است‌که درت‌زدان‌ ا

‌ویژگ د کمم ی‌ ‌این‌‌].54[های‌ یشم ی‌اسمخ اج‌کنرتوانر‌تعراد ‌الگوریمم‌در تفاوت‌ ین‌این‌دو

‌ ‌در ‌اخملاف‌تفاضل ‌‌ SIFTداننر‌DSIFTاست‌که ‌ک دن‌نقاط‌کلیری‌ اساس‌فیلم نیازی‌ ه‌پیرا

(DOG‌) د کز‌ه ‌ لوک‌‌در‌ها اشر‌و‌ ا‌در‌نظ ‌گ فمن‌ی ‌گام‌دشخص‌در‌جست‌سط ها‌و‌سموننم

n در‌واقع.‌شود ای‌ه ‌تصوی ‌ایجاد‌د n×040 دار‌ویژگ ‌ ا‌ا عاد‌.‌دگ دی ‌توصیفگ ‌اسمخ اج‌د

همانطور‌که‌ یان‌شر‌این‌نقاط‌‌.است‌ویژگ ‌اسمخ اج‌شرهدر‌آن‌ ا ‌ ا‌دجموع‌تمام‌نقاط ‌است‌که‌

‌.دهنرهای‌ی ‌شبکه‌دنظم‌را‌تشکیل‌د گ ه

دکیان ‌‌این‌اسیت‌کیه‌ یه‌طیور‌واضیح‌دوقعییت‌‌‌‌‌‌‌‌های‌کرگذاری‌دثل‌فیش ‌یک ‌از‌دشکلات‌رو

هیا‌‌‌ ین ‌صحیح‌دشخصیه‌‌پیش‌.کننر‌که‌ ای‌توصیف‌کلمه‌ سیار‌دسم‌است‌کرگذاری‌نم ها‌را‌‌ویژگ

و‌تشیخیص‌‌‌‌که‌شیریراً‌ یا‌عملکی د‌نسیای ‌در‌عملییات‌‌‌‌‌‌اهمیت‌خیل ‌زیادی‌دارد‌چ ادر‌دکان‌دناسب‌

اسیمخ اج‌‌‌DSIFTویژگی ‌‌‌040،‌ یه‌‌GMM ه‌همین‌دلیل‌ ی ای‌آدیوز ‌‌‌.‌همبسمگ ‌داردشناس ‌‌ از

‌.رسرد ‌091ها‌ ه‌شود‌و‌ا عاد‌ویژگ نقاط‌آنسا‌نیز‌اضافه‌د ‌شره،‌دخمصات‌دکان

شود‌ لکه‌ا میرا‌تصیوی ‌ یه‌‌‌‌اسمفاده‌نم ‌GMMها‌کل‌تصوی ‌ صورت‌یکجا‌ ای‌آدوز ‌از‌ویژگ ‌

شیونر‌و‌‌های‌ه ‌ناحیه‌ یه‌صیورت‌دسیمقل‌از‌هیم‌در‌نظی ‌گ فمیه‌دی ‌‌‌‌‌‌‌ناحیه‌تقسیم‌شره‌و‌ویژگ ‌04

GMM‌‌ در‌نظی ‌گی فمن‌‌‌.‌شیود‌هیای‌همیان‌ناحییه‌آدیوز ‌داده‌دی ‌‌‌‌‌روی‌ه ‌ناحیه‌ ا‌توجه‌ ه‌ویژگی

ین ‌مایج‌ سم ی‌در‌پیشن‌اخمصاص‌داده‌شره‌ ه‌ه ‌ناحیه‌GMMها‌و‌آدوز ‌دخمصات‌دکان ‌ویژگ

ی‌آن‌اسمفاده‌شیره‌اسیت‌کیه‌پارادم هیا‌‌‌‌‌GMMگاوس ‌در‌ه ‌‌05از‌.‌داردها‌در‌دحل‌صحیح‌‌دشخصه

‌Ʃهیا،‌‌گوسی ‌‌دییانگین‌‌μ،‌دخلیوط‌هیا‌در‌‌گوسی ‌وزن‌‌w.‌اسیت‌‌μk ,Ʃk ,k=1…K} g={wk, صیورت‌

1 Dense Scale Invariant Feature Transform(DSIFT)

Page 68: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

51

ناحییه‌‌‌‌04 یا‌در‌نظی ‌گی فمن‌‌‌‌GMMدر‌نسایت‌.‌ها‌استتعراد‌گاوس ‌kو‌‌هاگوس (قط ی)کوواریانس

‌:شودناحیه‌روی‌تصوی ‌د احل‌زی ‌انجام‌د ‌04 ای‌ایجاد‌.‌ اشرگاوس ‌د 04×05=024دارای‌

‌ا (0 ‌اینکه ‌دلیل ‌شونر ه ‌ن دال ‌ ایر ‌نقاط ‌دکان ‌دخمصات ‌است ‌دمفاوت ‌هم ‌ ا ‌تصاوی .‌عاد

ه‌ت تیب‌ارتفاع‌و‌‌‌wو‌‌h .‌گی نرق ار‌د ‌5/1و‌‌-5/1 ین‌(‌07-9) ا‌روا ط‌‌ yو‌xدخمصات‌

.‌‌‌ع ض‌تصوی ‌هسمنر

(9-07)‌

)-0.5 ,

)-0.5

ایین‌‌.‌شیود‌دو‌ ازه‌ صورت‌زی ‌در‌نظی ‌گ فمیه‌دی ‌‌‌‌yشش‌ ازه‌و‌در‌جست‌دحور‌‌xدر‌جست‌دحور‌

‌.انرها‌ ای‌تمام‌تصاوی ‌ثا ت‌ف ض‌شره ازه

Intervals the axial direction X = [-0.5,-0.33], [-0.33,-0.166], [-0.166,0], [0,0.166], [0.166,0.33], [0.33,0.5]

Intervals the axial direction Y = [-0.5,0] , [0,0.5]

ناحیه‌روی‌تصوی ‌ایجاد‌شره‌که‌ ا‌در‌نظ ‌گ فمن‌دخمصیات‌دکیان ‌‌‌‌04ها،‌ ا‌توجه‌ ه‌این‌ ازه (4

-این‌ناحیه‌5-‌9شکل‌‌در.‌کنرها‌اخمصاص‌پیرا‌د ها،‌ه ‌ی ‌از‌آنسا‌ ه‌یک ‌از‌این‌ ازهویژگ

.نشان‌داده‌شره‌است‌"دسمقیم"ی‌ها‌ ای‌کلمه

ی‌دسمقیمی‌ثا ت‌ ‌روی‌تصوی ‌کلمهناحیه‌ ا‌انرازه‌04ایجاد‌:‌5-‌9شکل‌

د احل‌این‌رو ‌ ه‌.‌شودکلمه‌اسمفاده‌د ‌451از‌‌GMMطور‌که‌ یان‌شر‌ ای‌آدوز ‌همان

‌ ای‌تمام‌ ‌ناحیه‌451این‌صورت‌است‌که‌ا مرا های‌د وط‌ ه‌ نری‌انجام‌شره‌و‌تمام‌ویژگ کلمه،

Page 69: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

50

‌در‌کنار‌یگریگ ‌ق ار‌گ فمه‌و‌ ه‌همین‌ت تیب‌ویژگ ناحیه ‌ناحیه‌دوم‌تا‌ی‌اول‌آنسا، های‌د وط‌ ه

‌کلمه‌در‌ی ‌دجموعه‌ق ار‌د ‌451دوازدهم‌ ه‌صورت‌جراگانه‌ ای‌این‌ ا‌‌GMMگی نر‌و‌ه ‌ ار

‌.‌ ینرهای‌د وط‌ ه‌ه ‌ناحیه‌آدوز ‌د ویژگ

‌آدوز ‌ ‌ا عاد‌ویژگ GMMقبل‌از ‌رو ‌تحلیل‌دولفه، ‌ ا ‌‌0(PCA)های‌اصل ها ‌‌040از ‌54 ه

ا عاد‌پارادم های‌.‌رسرد ‌55ها‌ ه‌ا عاد‌ویژگ ‌ ا‌اضافه‌ک دن‌دو‌دخمصات‌دکان .‌کنرکاهش‌پیرا‌د

GMMاشرد ‌55×024و‌کوواریانس‌‌55×024،‌دیانگین‌0×024 ای‌وزن‌ ا ‌ ا‌‌‌ .‌

ا‌رو ‌توضیح‌داده‌شره‌در‌ الا،‌اسمخ اج‌ دارهای‌فیش ‌ ای‌ه ‌‌GMM عر‌از‌آدوز ‌درل‌

‌:شودی‌فارسا‌ط ‌د احل‌زی ‌انجام‌د ی ‌از‌تصاوی ‌پایگاه‌داده

.شونر صورت‌دم اکم‌از‌ه ‌تصوی ‌اسمخ اج‌شره‌و‌ن دال‌د ‌‌ SIFTهایویژگ (0

.شونرن دال‌د ‌5/1و‌‌-5/1دخمصات‌نقاط‌کلیری‌ ین‌ (4

.یا رکاهش‌د ‌54 ه‌‌040ها‌از‌ا عاد‌ویژگ ‌PCA ا‌رو ‌ (9

.شودد ‌55ها‌اضافه‌شره‌و‌ا عاد‌دخمصات‌دکان ‌ ه‌ویژگ (5

،‌ دار‌فیش ‌ ای‌ه ‌تصوی ‌ صورت‌سمون ‌ ا‌GMMادم های‌درل‌ها‌و‌پار ا‌توجه‌ ه‌ویژگ (5

.شوداسمخ اج‌د ‌45575×0ا عاد‌

‌دات یس‌ویژگ (5 ‌انمسا ‌در ‌ا عاد ‌دارای ‌ اشرد ‌45575×09511های‌فیش ‌این‌. ‌از ‌سمون ه

.ی‌ی ‌نمونه‌استدهنرهدات یس‌نشان

ی‌زی ‌دحاسبه‌شره‌طبق‌را طه‌ا عاد‌ دار‌فیش ‌4-9 ا‌توجه‌ ه‌توضیحات‌ارائه‌شره‌در‌ خش‌

‌‌:است

(PCA)Analysis ComponentPrincipal 1

Page 70: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

54

‌ هاتعراد‌گوس ‌×‌Yتعراد‌نواح ‌‌×‌Xتعراد‌نواح ‌‌×(‌4+ها‌ا عاد‌ویژگ )‌×4=ا عاد‌ دار‌فیش ‌=‌45575

آموزش فضای مشخصه 9-9-9

‌ ‌رو ‌از ‌اسمفاده ‌و ‌فارس ‌الفبای ‌گ فمن ‌نظ ‌در ‌PHOC ا ‌دارد‌555، ‌وجود ‌دشخصه ای‌.

اظ ‌منهای‌دمن ‌دی‌فارسا،‌رشمه ای‌تمام‌تصاوی ‌دوجود‌در‌پایگاه‌دادهها،‌ا مرا‌آدوز ‌این‌دشخصه

های‌های‌دمن ‌تبریل‌ ه‌ چسباین‌رشمه‌0-9-9سپس‌ ا‌رو ‌ یان‌شره‌در‌ خش‌.‌شونرایجاد‌د

PHOC‌ ی‌دهنرهه ‌سط ‌این‌دات یس‌نشان.‌شودایجاد‌د ‌555×09511شونر‌و‌دات یس ‌ ا‌ا عاد‌د

ا‌در‌نظ ‌گ فمن‌این‌دات یس‌و‌دات یس‌.‌ی‌ی ‌کلمه‌استدهنرهون‌آن‌نشانی ‌دشخصه‌و‌ه ‌سم

خط ‌اسمفاده‌شره‌‌SVM ای‌آدوز ‌از‌.‌گی دها‌صورت‌د دارهای‌فیش ‌تصاوی ،‌آدوز ‌دشخصه

‌.نشان‌داده‌شره‌است 5-‌9شکل‌د احل‌این‌رو ‌در‌.‌است

‌"کشور"‌"قیمت"‌"کاهش"‌"سازدان"

‌"اداری"‌"ش کت"‌"سال"‌" رس "

‌‌‌‌‌‌‌‌‌‌‌

‌‌خط ‌SVMاُم‌ ا‌iی‌ف آینر‌آدوز ‌درل‌دشخصه :5-‌9شکل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

ی‌در‌د حلیه‌‌ی‌دشیم ک‌دار ی ‌و‌فضیای‌‌در‌ایین‌د حلیه‌‌‌یک ‌از‌دشکلات‌آدوز ‌فضای‌دشخصه‌

‌که‌ ی ای‌‌هایین‌دوضوع‌ ه‌این‌دلیل‌است‌که‌دادها‌. اشری‌ زرگ‌د ه‌داشمن‌پایگاه‌داده‌نیاز،‌ عری

‌‌های‌فیش دار

‌45575×09511:ا عاد

‌ها چسبآدوز ‌

تصاویر

های متنیرشته

‌‌PHOCهای‌ چسب

‌555×09511:ا عاد

ی‌آدوز ‌دشخصه

i ُام

هاآدوز ‌نمونه

Page 71: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

59

‌که‌ ی ای‌ییادگی ی‌فضیای‌دشخصیه‌‌‌‌‌هاینر‌ ایر‌از‌دادهشواسمفاده‌د ‌دشم ک‌ داری‌آدوز ‌فضای

ای‌فاده‌ ی ‌دیورد‌اسیم‌‌‌هایدادهکه‌اگ ‌همان‌علت‌این‌دساله‌این‌است‌‌.رنر‌دمفاوت‌ اشنشواسمفاده‌د

ه‌شرت‌‌SVMهای‌رتبه‌اسمفاده‌ک د،یادگی ی‌فضای‌دشخصه‌را‌ ای‌آدوز ‌فضای‌ داری‌دشم ک‌

نیا این‌فضیای‌ ی داری‌‌‌‌.‌(خواهنیر‌شیر‌‌‌0-یا‌‌0 یشم ‌آنسا‌خیل ‌نزدی ‌ ه‌)‌خواهنر‌ ود‌0 از یش

‌این‌دوضیوع‌ اعیث‌‌‌ها‌شریرا‌ ایاس‌خواهنر‌داشت‌کهدشم ک‌آدوز ‌داده‌شره‌ ا‌اسمفاده‌از‌این‌داده

‌‌.افت‌نمایج‌د ‌شود

های‌آدوز ‌ ه‌داده،‌کنیمد اسمفاده‌‌baggingاز‌آدوز ‌توسط‌رو ‌‌ ای‌غلبه‌ ‌این‌دشکل

‌انرتقسیم‌ نری‌شره‌4سنج های‌دخملف‌آدوز ‌و‌اعمبار خش های‌ی ‌دشخصه‌ ا‌اسمفاده‌از‌داده.

‌د ‌ خش‌آدوز ‌داده ‌ ای‌رتبهآدوزش ‌آن ‌و ‌شود ‌اعمباردادهده ، ‌د های ‌اسمفاده .‌شونرسنج

فضای‌ داری‌ها‌ ای‌آدوز ‌از‌همین‌داده .های‌اعمبارسنج ‌ رون‌ ایاس‌استهای‌داده نا این‌رتبه

‌.‌شودگام‌ عر‌اسمفاده‌د ‌در‌دشم ک

-داده.‌شودانجام‌د ‌5و‌ه ‌د حله‌در‌پنج‌تک ار‌9د حلهدر‌این‌رو ،‌آدوز ‌ه ‌دشخصه‌در‌دو‌

ه‌طور‌کل ‌در‌ه ‌تک ار‌ی ‌قسمت‌از‌‌.هسمنر‌دسمقلاز‌هم‌‌تک ارهای‌آدوز ‌و‌اعمبارسنج ‌ه ‌

گی د‌ ه‌طوری‌که‌در‌پایان‌پنج‌تک ار‌تمام‌سنج ‌ق ار‌د ی‌اعمبارهای‌آدوز ‌ ه‌عنوان‌دجموعهداده

ای‌آدوز ‌در‌ه ‌ .‌انرده ‌شرهسنج ‌رتبهی‌اعمباری‌آدوز ‌یکبار‌ ه‌عنوان‌دادهعههای‌دجموداده

‌.شونرها‌ صورت‌تصادف ‌د تب‌د د حله‌داده

‌ل ا‌ن دا‌.شودد های‌دحل ‌حاصل‌گی ی‌همه‌درل ا‌دیانگین‌در‌انمسای‌پ داز ،‌ی ‌درل‌کل

های‌ رون‌ده ‌شره‌است‌رتبهه ‌نمونه‌ ه‌وسیله‌تعراد‌دفعات ‌که‌آن‌نمونه‌رتبه‌دشخصه‌ک دن‌رتبه

1 Over fit 2 Validation

3 Pass

4 Iteration

Page 72: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

55

‌فضای‌ داری‌دشم کتوانر‌ رون‌دشکل ‌ ای‌آدوز ‌که‌د ‌شودد ایاس‌دجموعه‌یادگی ی‌ایجاد‌

‌:امُ‌ ه‌صورت‌زی ‌استiی‌ ه‌طور‌کل ‌د احل‌آدوز ‌دشخصه.‌اسمفاده‌شود

های‌دثبت‌و‌دنف ‌ ای‌این‌،‌نمونه‌PHOCامُ‌دات یس‌ چسبi ا‌توجه‌ ه‌سط ‌:‌ی او مرحله

اشنر‌در‌واقع‌های‌دثبت،‌کلمات ‌هسمنر‌که‌دارای‌این‌دشخصه‌د نمونه)‌.شونردشخصه‌تعیین‌د

های‌دنف ‌که‌دارای‌این‌دشخصه‌نیسمنر‌امُ‌ی ‌ق ار‌گ فمه‌و‌ ای‌نمونهiها‌در‌سط ‌ ای‌این‌نمونه

‌(امُ‌صف ‌ق ار‌داردiدر‌سط ‌

‌.شونرهای‌دثبت‌و‌دنف ‌ صورت‌تصادف ‌د تب‌د دجموعه‌نمونه:‌ی دوممرحله

‌ی سومرحلهم :‌ ،‌ ‌تک ار ‌نمونه‌01دره ‌اول‌دجموعه ‌دنف ‌ ای‌د حلهدرصر ی‌های‌دثبت‌و

‌.شونردر‌نظ ‌گ فمه‌د سنج ی‌اعمباردرصر‌ اقیمانره‌ ای‌دجموعه‌41آدوز ‌و‌

‌نمونههای‌آدوز ‌و‌اعمباردجموعه در :ی چهارممرحله -های‌دثبت‌و‌سپس‌نمونهسنج ‌ا مرا

‌.گی دهای‌دنف ‌ق ار‌د

های‌ دارهای‌فیش ‌و‌ چسب‌سنج ،‌دات یسی‌آدوز ‌و‌اعمبار ای‌دجموعه :ی پنجممرحله

-شود‌که‌ ای‌تمام‌نمونه دار‌ چسب‌ ه‌این‌صورت‌ایجاد‌د .‌)شونر ا‌توجه‌ ه‌د احل‌ الا‌ایجاد‌د

‌(شوددر‌نظ ‌گ فمه‌د ‌-0های‌دنف ‌و‌ ای‌نمونه‌0های‌دثبت‌

نیر‌‌پارادم هیای‌ورودی‌ یه‌طبقیه‌‌‌.‌گی دصورت‌د خط ‌‌SVMآدوز ‌توسط‌: ی ششممرحله

SVMنیر،‌ ی دار‌‌‌ی‌آدیوز ‌و‌خ وجی ‌ایین‌طبقیه‌‌‌‌،‌دات یس‌ دارهای‌فیش ‌و‌ دار‌ چسب‌دجموعه

‌.امُ‌استiیسمون ‌وزن‌و‌دقرار‌ ایاس‌ ه‌ازای‌دشخصه

-رتبه‌دشخصه‌ ای‌داده‌ی‌قبل ه‌ازای‌ دار‌وزن‌نسای ‌ رست‌آدره‌از‌د حله:‌هفتمی مرحله

‌.شود دار‌سمون ‌وزن‌و‌دقرار‌ ایاس‌در‌ه ‌تک ار‌ذخی ه‌د .‌شودهای‌اعمبارسنج ‌دحاسبه‌د

Page 73: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

55

‌رتبه‌دشخصه ‌Sc)ها ‌را طههای‌اعمبار ای‌داده( ‌00-9)ی‌سنج ‌از )‌ ‌شودد دحاسبه ‌این‌. در

. اشر دار‌وزن‌د ‌wی‌اعمبار‌سنج ‌و‌دات یس‌ دارهای‌فیش ‌ ای‌دجموعه‌ FVval را طه‌

(9-00)‌

‌هشتمی مرحله ‌رو ‌تغیی ‌دکان‌دای هروی‌دجموع‌داده: 0ایهای‌های‌دجموعه ه‌تعراد‌داده‌

‌)شودسنج ‌انجام‌د اعمبار سنج ‌عوض‌شره‌و‌در‌پایان‌های‌اعمباراین‌صورت‌در‌ه ‌تک ار‌داده ه‌.

‌(ی‌اعمبارسنج ‌ظاه ‌شره‌استی‌آدوز ‌یکبار‌در‌دجموعهی‌دجموعهپنج‌تک ار‌ه ‌داده

شود‌تا‌پنج‌تک ار‌تمام‌ی‌سوم‌ ازگشمه‌و‌دو اره‌د احل‌انجام‌د ه‌ا مرای‌د حله:‌نهمی مرحله

‌.‌شود

‌ی دهممرحله‌ :‌ ‌رتبه عر‌از ‌ه ‌نمونه‌یکبار ‌ده ‌شره‌استاتمام‌پنج‌تک ار، ای‌اینکه‌یکبار‌.

‌.شودی‌دوم‌ ازگشمه‌و‌د احل‌دو اره‌تک ار‌د ی‌آدوز ‌تک ار‌شود‌ ه‌د حلهدیگ ‌د حله

‌آدوز ‌ ای‌دشخصه ‌پایان‌ف آینر ‌دحاسبهiی‌در ‌ ا ‌وزن‌نسای ‌ ای‌این‌دشخصه ‌ دار ی‌اُم،

دقرار‌ ایاس‌نسای ‌.‌آیر رست‌د ‌01آدره‌از‌ه ‌تک ار‌و‌تقسیم‌آن‌ ‌‌های‌وزن‌ رستدجموع‌ دار

ی‌دجموع‌ی‌نسای ‌ ا‌دحاسبه دار‌سط ی‌رتبه‌دشخصه.‌شودگی ی‌د هم‌ ه‌همین‌صورت‌دیانگین

‌.شوددحاسبه‌د ‌4ی‌ رست‌آدره‌از‌ه ‌د حله‌ ا‌تقسیم‌ ‌های‌رتبه‌دشخصه دار

ه‌ازای‌ه ‌دشخصه‌این‌.‌ن‌رو ‌ دار‌وزن‌ رست‌آدره‌است ا‌همی‌555تا‌‌0ی‌ها ای‌دشخصه

‌Wها،‌دات یس‌ی‌دشخصهدر‌نسایت‌ ا‌در‌نظ ‌گ فمن‌همه.‌ اشرد ‌45575×0 دار‌سمون ‌دارای‌ا عاد‌

1 Circular Shift

Page 74: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

55

ی‌آن،‌دارای‌ ای‌ه ‌دشخصه،‌ دار‌سط ی‌رتبه‌دشخصه.‌شودایجاد‌د ‌45575×555نسای ‌ ا‌ا عاد‌

‌. اشرد ‌555×09511 یس‌رتبه‌دشخصه‌نسای ‌دارای‌ا عاد‌که‌دات.‌است‌0×09511ا عاد‌

ود،‌ ای‌آن‌دشخصه،‌ دار‌وزن،‌ دار‌‌4های‌دثبت‌آن‌کمم ‌از‌ ای‌ه ‌دشخصه‌اگ ‌تعراد‌نمونه

‌.گی درتبه‌دشخصه‌و‌دقرار‌ ایاس‌صف ‌در‌نظ ‌گ فمه‌شره‌و‌در‌واقع‌آدوزش ‌صورت‌نم

فضای برداری مشترکها در ها و برچسبتعبیه رتبه مشخصه 9-9-1

تصیاوی ‌در‌فضیای‌‌‌‌تعبیههای‌دمن ‌در‌فضای‌ چسب‌و‌رشمه‌تعبیههای‌قبل ‌رو ‌در‌ط ‌ خش

نمایش‌تصاوی ‌کلمات‌ ‌پایه‌رتبه‌دشخصه‌و‌تعبیه‌آنسا‌در‌فضیای‌دشخصیه،‌ اعیث‌‌‌‌.‌دشخصه‌ یان‌شر

فضای‌ چسب‌و‌دشخصه‌هی ‌‌.‌شود‌که‌در‌دقا ل‌تغیی ات‌ظاه ی‌کلمات‌دقاوم‌استایجاد‌نمایش ‌د

اشینر‌در‌‌‌شره‌ این ی‌د ‌تعبیههای‌دمن ‌‌ول ‌ ه‌این‌دلیل‌که‌ چسبدو‌دارای‌ا عاد‌یکسان ‌هسمنر‌

.‌ی‌دمفاوت ‌هسمنر‌دقایسه‌آنسا‌در‌ایین‌فضیا‌دناسیب‌نیسیت‌‌‌‌‌های‌دشخصه‌دارای‌دحروده‌حالیکه‌رتبه

‌.‌ اشردورد‌نیاز‌د ‌PHOCهای‌های‌دشخصه‌و‌ چسب،‌رتبهالیب اسیونک نا این‌

یا‌اسیمفاده‌از‌‌‌‌.اسمفاده‌شره‌اسیت‌‌(CCA) سمگ ‌کانون تحلیل‌هم‌ ای‌حل‌این‌دشکل‌از‌رو

شونر‌کیه‌در‌‌در‌ی ‌فضای‌ داری‌دشم ک‌تعبیه‌د ‌PHOCهای‌ها‌و‌ چسباین‌رو ‌رتبه‌دشخصه

که‌د وط‌ یه‌‌‌PHOCدشخصه‌و‌ چسب‌‌در‌این‌فضا‌رتبه.‌است‌داکزیمم ین‌آنسا‌‌همبسمگ این‌فضا‌

کیه‌‌‌ی‌دمن ‌اوی ‌و‌رشمهدر‌این‌فضا‌تص ه‌عبارت‌دیگ ‌.‌ی ‌کلمه‌هسمنر،‌نزدی ‌ ه‌یگریگ ‌ق ار‌دارنر

‌ ازشناسی ‌دهر‌که‌عملییات‌‌‌ی‌کلمه‌یکسان‌هسمنر‌نزدی ‌ ه‌یکریگ نر‌و‌این‌اجازه‌را‌د ‌دهنره‌نشان

‌‌.ت ین‌همسایگ ‌انجام‌شود‌نزدی ‌ ه‌صورت‌دسئله

و‌دشخص‌‌شناسای ‌ها‌و‌ اهمزدان‌دجموعه‌یلو‌تحل‌یه ا‌تجز‌ ،کانون‌ همبسمگ‌یلو‌تحل‌تجزیه

‌ ‌ی دجموعه‌دمغ‌ی از‌‌یک دن‌عناص ‌یگ ،د‌ی عناص ‌دجموعه‌دمغ‌ ا‌و‌ارتباط‌ وا سمگ‌یشم ین ا

‌ ‌یروا ط‌آدار ‌دجموعه‌دمغ‌یندسمقل‌دوجود ‌آ‌را‌ی دو ‌ددورد زاری‌ا ‌‌CCA].59[دهر زدون‌ق ار

Page 75: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

57

‌ ه‌هم‌د تبط‌د ‌هایهای‌تصوی ‌و‌ چسب‌گ توصیفاست‌که‌ دزایای‌این‌رو ‌.‌کنر‌دنماظ شان‌را

‌این‌تحقیق‌‌.دارد‌ نریو‌خوشه‌ف اوان ‌ ای‌عملیات‌ ازیا ‌این‌د حله‌دسمیا ‌ ه‌در دو‌هرف‌از

ها‌از‌فضای‌دشخصه‌و‌ چسب‌ ه‌فضای‌داده‌،است‌که‌توسط‌این‌دو‌دات یس Vy و Uxنگاشتدات یس‌

‌.شونرد ‌نگاشت داری‌دشم ک‌

رست‌آدره‌از‌د احل‌قبل‌ ا‌توجه‌ یه‌‌‌PHOCو‌ چسب‌‌در‌این‌رو ‌ا مرا‌دات یس‌رتبه‌دشخصه

درصیر‌‌‌91سپس‌ ای‌این‌د حله‌.‌شونراست‌ ه‌صورت‌تصادف ‌د تب‌د ‌09511ها‌اینکه‌تعراد‌نمونه

‌.‌شونردانره‌ ای‌آدوز ‌اسمفاده‌د درصر‌ اق ‌71اعمبارسنج ‌و‌اول‌دجموعه‌ ای‌

تصوی ‌دوجیود‌ ی ای‌‌‌‌Nی‌از‌ادجموعه‌ I={In, n=1,….N}شود‌که‌ ای‌حل‌این‌دساله‌ف ض‌د

ی‌طبیق‌را طیه‌‌.‌های‌دمناظ ‌ ا‌آنسا‌اسیت‌ی‌ چسبدجموعه L={Ln, n=1,….N} اشر‌و‌آدوز ‌د

(9-02)‌،Xی‌دجموعه‌Nی‌ست‌که‌در‌فضای‌دشخصهتصوی ی‌ا‌dعُری‌ (d=654 )انر‌و‌تعبیه‌شرهY‌

‌.[55] اشر عری‌د ‌d چسب‌تعبیه‌شره‌در‌فضای‌ چسب‌‌Nی‌دجموعه

(9-02)‌‌

-دات یس.‌شوددشخص‌د ‌y μ و‌x μدر‌راسمای‌سط ها‌ ا‌پارادم های‌‌Yو‌Xی‌دجموعهدیانگین‌

.آینر رست‌د (‌49-9)تا‌(‌41-9)توسط‌روا ط‌‌Cxyو‌‌Cxx ،Cyy ، Cyxهای‌

(9-41)‌

(9-40)‌

(9-44)‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌‌‌‌‌

(9-49)‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌‌‌‌‌

هیرف‌ییافمن‌‌‌.‌دیات یس‌همیان ‌اسیت‌‌‌‌Iو‌‌)0.00001ρ= (ضی یب‌تنظییم‌اسیت‌‌‌‌ρدر‌این‌روا یط‌‌

Page 76: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

50

‌:‌‌است(‌45-9)ی‌طبق‌را طه‌ Vy و‌Uxهای‌دات یس

(9-45)‌

ی‌دات یس‌که‌دعادل‌ ا‌ دارهای‌ویژه‌ Uxدات یس(‌45-9)و‌(‌45-9)ی‌ها ا‌در‌نظ ‌گ فمن‌را طه

Z‌ آیراست‌ رست‌د.

(9-45)‌‌

(9-45)‌

نییز‌‌‌Vy ا‌ی ‌رو ‌دشیا ه‌دیات یس‌‌‌.‌است‌d×kدارای‌ا عاد‌‌Uxدات یس‌‌k=128 ا‌در‌نظ ‌گ فمن‌

‌k عُیری‌در‌فضیای‌‌‌‌dها‌از‌فضای‌ها‌و‌ چسبتوسط‌این‌دو‌دات یس،‌رتبه‌دشخصه.‌ رست‌آدره‌است

دهر‌که‌ا عاد‌خ وج ‌را‌کنم ل‌نموده‌و‌کاهش‌ا عیاد‌‌این‌رو ‌اجازه‌د در‌واقع‌.شونر عُری‌تعبیه‌د

‌.را‌نیز‌انجام‌داد

‌دات یس ‌دو ‌آوردن ‌ رست ‌و ‌ الا ‌دعادلات ‌‌ Uxحل ‌ ونVyو ‌ صورت ‌یکبار ‌د حله، ‌در ی‌خط

ار‌ ا‌توجه‌ ه‌اینکه‌در‌فضای‌دشخصه‌ق زدان‌آزدون‌ی ‌نمونه در.‌شودآدوز ‌انجام‌د

‌توسط ‌فضای‌ چسب، دارد‌یا یا‌

-در‌فضای‌ داری‌دشم ک‌تعبیه‌د

‌.‌شود

عملیات بازشناسی 9-9-5

ای‌ه ‌.‌شونری‌قبل‌در‌فضای‌ داری‌دشم ک‌تعبیه‌د های‌اعمبارسنج ‌ ا‌توجه‌ ه‌د حلهداده

دات یس‌رتبه‌دشخصه‌تعبیه‌شره‌در‌این‌فضا‌.‌ها،‌کلاس‌دورد‌نظ ‌آن‌نمونه‌دشخص‌استی ‌از‌نمونه

عملیات‌ ازشناس ‌ط ‌.‌شونرنمایش‌داده‌د ‌Lϕو‌دات یس‌ چسب‌تعبیه‌شره‌در‌این‌فضا‌ ا‌ I ϕ ا‌

:‌شوددو‌د حله‌انجام‌د

ی‌ی ‌کلمه‌یکسان‌هسمنر‌دهنرههمان‌طور‌که‌قبلا‌نیز‌ یان‌شر‌در‌این‌فضا‌تصاوی ی‌که‌نشان

Page 77: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

52

در‌واقع‌تصوی ‌ه ‌.‌ اشری‌اول،‌پ سش‌توسط‌تصوی ‌کلمات‌د در‌د حله.‌نزدی ‌ ه‌یگریگ ‌ق ار‌دارنر

-ای‌در‌دجموعهی‌ض ب‌داخل ،‌نمونه ا‌دحاسبه.‌نمونه‌ ه‌عنوان‌ی ‌پ سش‌در‌نظ ‌گ فمه‌شره‌است

‌که‌ ه‌کلمهی‌داده ‌نظ ‌نزدیکم ‌است‌دشخص‌ها ض ب‌داخل ‌ ین‌سمون‌)شود‌د ی‌پ سش ‌دورد

در‌این‌حالت‌اگ ‌(.‌شوددحاسبه‌د Iϕ ا‌دات یس‌ Iϕپ سش ‌دورد‌نظ ‌در‌دات یس‌ی‌د وط‌ ه‌کلمه

ی‌پ سش ‌دورد‌نظ ‌یکسان‌ ود‌عملیات‌ ازشناس ‌در‌دورد‌کلاس‌این‌نمونه‌ ا‌کلاس‌د وط‌ ه‌کلمه

‌‌.نادرست‌انجام‌شره‌استاین‌نمونه‌درست‌در‌غی ‌این‌صورت‌

‌در‌نظ ‌گ فمن‌این‌دساله‌که‌در‌این‌فضا‌رشمه‌در‌د حله ‌ ا -ی‌دمن ‌و‌تصوی ی‌که‌نشاندوم،

در‌این‌حالت‌.‌شودی‌ی ‌کلمه‌یکسان‌هسمنر‌نزدی ‌ ه‌یکریگ نر‌عملیات‌ ازشناس ‌انجام‌د دهنره

پایگاه‌‌در‌واقع‌هرف‌از‌ ازشناس ‌یافمن‌تصوی ی‌در.‌شودی‌دمن ‌کلمات‌انجام‌د پ سش‌توسط‌رشمه

‌این‌رشمه ‌دمناسب‌ ا ‌است‌که ‌ اشرداده ‌ی‌دمن ‌رشمه. ‌در‌ ای‌ه ‌آن ‌د وط‌ ه ی‌دمن ‌سمون

نزدیکم ین‌تصوی ‌ ،Iϕی‌ض ب‌داخل ‌ ین‌آن‌و‌دات یس‌در‌نظ ‌گ فمه‌شره‌و‌ ا‌دحاسبه Lϕدات یس‌

ت‌ ازشناس ‌اگ ‌کلاس‌د وط‌ ه‌ه ‌دوی‌آنسا‌یکسان‌ ود‌عملیا.‌شودی‌دمن ‌دشخص‌د ه‌این‌رشمه

‌.ی‌دمن ‌درست‌در‌غی ‌این‌صورت‌نادرست‌انجام‌شره‌استدر‌دورد‌این‌رشمه

ی بازشناسینتایج مرحله 9-9-5-4

ی‌سینج ‌پایگیاه‌داده‌‌هیای‌اعمبیار‌‌همان‌طور‌که‌قبلا‌نیز‌ یان‌شر‌عملیات‌ ازشناس ‌ ‌روی‌داده

-نمیایج‌ ازشناسی ‌روی‌داده‌‌‌0-‌9جرول‌.‌شودفارسا‌که‌شادل‌تصاوی ‌کلمات‌ یره‌شره‌است‌انجام‌د

‌Pدر‌ایین‌جیرول‌‌‌.‌دهیر‌سنج ‌ ای‌دو‌حالت‌پ سش‌ ا‌تصوی ‌و‌پ سش‌ ا‌دمن‌را‌نشان‌د های‌اعمبار

دموسط‌دقت‌ ازشناسی ‌‌دیانگین‌‌MAPانر‌و‌ ازشناس ‌شره‌دیانگین‌تعراد‌کلمات ‌است‌که‌ ه‌درسم

‌.‌دهررا‌نشان‌د

Page 78: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

51

ی‌ ازشناس نمایح‌د حله:‌0-‌9جرول‌

‌P MAP

‌QBE 50/27‌5/29حالت‌

‌QBS 011‌2/27حالت

Page 79: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

50

5 ‌

:فصل چهارم

الگوریتم پیشنهادی و نتایج ارزیابی آن

Page 80: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

54

مقدمه 1-4

ی‌فارس ‌نوشمهجسمجوی‌کلمات‌کلیری‌در‌تصوی ‌دست ای شره پیشنساد رو ‌فصل این در

‌شر خواهر یان .‌ ‌عبارت‌دیگ ‌کلمه ه ‌این‌است‌که ‌ناده ‌دمن‌هرف‌پایان ‌در ‌نظ ی‌پ سش ‌دورد

های‌این‌یک ‌از‌دسمم ین‌تفاوت.‌شودهای‌آن‌کلمه‌در‌داخل‌دمن‌دشخص‌جسمجو‌شره‌و‌دکان‌نمونه

در‌این‌است‌که‌در‌این‌پایان‌ناده‌هرف،‌جسمجوی‌کلمات‌در‌داخل‌اسناد‌‌]55[ ا‌تحقیق‌‌پایان‌ناده

در‌‌. ه‌ ازشناس ‌تصاوی ‌کلمات‌جرا‌شره‌از‌دمن‌پ داخمه‌است‌]55[ اشر‌در‌حال ‌که‌تصوی ی‌د

‌داخل‌فایل‌توانر‌کلمهاین‌رو ‌کار ‌د ‌در ‌نظ ‌خود‌را توانر‌تایپ‌کنر‌و‌یا‌د Notepad ی‌دورد

از‌داخل‌ی ‌سنر‌تصوی ی‌جرا‌ی‌دورد‌نظ ‌را‌توان‌تصوی ‌کلمهد )ی‌دورد‌نظ ‌خود‌را‌تصوی ‌کلمه

در‌داخل‌سنر‌ ی‌پ سش های‌کلمه ه‌عنوان‌ورودی‌ ه‌سیسمم‌ رهر،‌سپس‌سیسمم‌دکان‌نمونه(‌ک د

‌دشخصتصوی ی‌ر ‌‌دثلا‌.کنرد ‌ا ‌ ا ‌کشیرن ‌‌ دسمطیلکادر ‌را ‌آن ‌آن‌کلمه، ‌.کنرد ‌دشخصدور

و‌ ای‌آدوز ‌از‌پایگاه‌‌FHTی‌آزدون‌از‌پایگاه‌داده‌همانطور‌که‌در‌فصل‌سه‌ یان‌شر‌ ای‌د حله

ی‌فارس ‌از‌دمون،‌در‌نوشمهتصوی ‌دست‌‌0111دارای‌‌FHTپایگاه‌داده.‌شوداسمفاده‌د داده‌فارسا‌

ف د‌دمفاوت‌‌45ه ‌دمن‌توسط‌‌ونوع‌دمن‌دمفاوت‌است‌‌51شادل‌‌که‌ اشردوضوع‌دخملف‌د ‌09

‌نوشمه‌شره‌است ‌تقاضا‌شره‌است‌. ‌ نویسر‌که‌در‌دجموع‌این‌‌5در‌واقع‌از‌ه ‌ف د دمن‌دمفاوت‌را

‌نویسنره‌دارد‌451پایگاه‌داده،‌ ‌075/491کلمه،‌‌5/015خط،‌‌55/5ه ‌دمن‌ ه‌طور‌دیانگین‌دارای‌.

‌0خطوط‌صحیحهای‌این‌پایگاه‌داده‌وجود‌یک ‌از‌دزیت.‌نقطه‌است‌0/094ح ف‌و‌‌0515ی ‌کلمه،‌ز

.‌ اشرنوشمه‌از‌کلمات‌دخملف‌د تصوی ‌دست09511ی‌فارسا‌شادل‌پایگاه‌داده‌. اشر ای‌ه ‌خط‌د

‌‌‌‌.های‌اف اد‌دخملف‌وجود‌داردنوشمهنمونه‌از‌دست‌55 ای‌ه ‌کلمه‌

او روش پیشنهادی 1-2

تصاوی ‌از‌فضای‌ویژگ ‌ یه‌فضیای‌‌‌‌تعبیه ای‌)‌‌Wوزنها،‌ رست‌آوردن‌دات یس‌آدوز ‌دشخصه

1 Ground Truth‌

Page 81: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

59

ه‌فضیای‌ ی داری‌‌‌‌ها چسبو‌‌هارتبه‌دشخصه‌تعبیه ای‌) Vy و‌ Uxهای‌نگاشتو‌دات یس(‌دشخصه

ی‌ ی ای‌د حلیه‌‌.‌انجیام‌شیر‌‌و‌رو ‌ یان‌شره‌در‌فصل‌سوم‌ی‌فارسا‌ ا‌اسمفاده‌از‌پایگاه‌داده(‌دشم ک

اسیمفاده‌از‌دو‌پایگیاه‌داده‌‌‌‌.شیود‌که‌شادل‌تصاوی ‌اسناد‌است‌اسمفاده‌د ‌FHTی‌آزدون‌از‌پایگاه‌داده

در‌ایین‌‌‌. اشیر‌ی‌قیررت‌تعمییم‌ یالای‌رو ‌دی ‌‌‌‌دهنرهکه‌دارای‌سب ‌نگارش ‌دمفاوت ‌هسمنر‌نشان

جیرا‌شیره‌‌‌ی‌پ سش ‌دورد‌نظ ‌در‌داخل‌دمن،‌ا مرا‌خطیوط‌دیمن‌از‌یگیریگ ‌‌‌‌حالت‌ ای‌یافمن‌کلمه

‌یی‌‌، ا‌اسمخ اج‌تصاوی ‌کلمات‌داخل‌دیمن‌.‌شودد سپس‌تصاوی ‌کلمات‌دوجود‌در‌ه ‌خط‌اسمخ اج‌

ی ای‌دجموعیه‌کلمیات‌کانرییر‌‌‌‌‌.‌شودی‌پ سش ‌دورد‌نظ ‌ایجاد‌د کلمات‌کانریر‌ ای‌کلمه‌دجموعه

.‌ره‌اسیت‌شی‌از‌قبل‌ذخیی ه‌‌‌ای‌که‌دخمص‌ه ‌تصوی ‌استو‌شماره‌دخمصات‌دکان ‌آنسا‌در‌داخل‌سنر

هرف‌این‌است‌که‌الگوریمم،‌.‌ ه‌عنوان‌ورودی‌الگوریمم‌هسمنر‌ی‌پ سش ی‌دمن ‌یا‌تصوی ‌کلمهرشمه

هیا‌در‌داخیل‌‌‌و‌دکان‌این‌نمونیه‌‌پیرا‌کنردر‌ ین‌دجموعه‌کلمات‌کانریر‌ی‌پ سش ‌را‌کلمههای‌نمونه

‌‌.نمایش‌داده‌شره‌است‌0-5د احل‌رو ‌در‌شکل‌.‌کنردشخص‌را‌سنر‌

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

د احل‌رو :‌0-‌5شکل‌

تصوی ‌سنری‌

که‌حاوی‌

ی‌‌کلمه

پ سش ‌دورد‌ .نظ ‌است

جراسازی‌

خطوط‌دمن‌از‌

یکریگ

اسمخ اج‌

‌‌‌تصاوی ‌

داخل‌کلمات‌

دجموعه‌)دمن‌‌(تصاوی ‌کانریر

ی‌‌کلمهتصوی

دورد‌پ سش

نظ

428: ابعاد

فضای

برداری

مشترک

151: ابعادی‌‌رشمه‌تعبیه

‌‌‌PHOCدمن ‌ ا‌ ‌

فضای برچسب

‌‌رشمه دمن ‌یی‌پ سش ‌‌کلمه

دورد‌نظ

ها برچسب تعبیه

ویژگی فضای مشخصه فضای

21571: ابعادکرگذاری‌

‌تصاوی های‌‌ دار ا‌

(F)فیش

151: ابعاد

ها مشخصه تعبیه

Page 82: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

55

در‌پایگاه‌.‌الگوریمم‌جراسازی‌خطوط‌و‌اسمخ اج‌تصاوی ‌کلمات‌دمن‌در‌فصل‌ عر‌ یان‌خواهر‌شر

‌پیکسل‌پیکسل‌FHTیداده ‌و ‌سیاه ‌پس‌زدینه ‌‌های ‌دهای ‌همین ‌ ه ‌هسمنر ‌سفیر ‌از‌قلم ‌ عر لیل

‌.شونرد اسمخ اج‌تصاوی ‌کلمات،‌آنسا‌ ه‌تصاوی ی‌ ا‌پس‌زدینه‌سفیر‌و‌قلم‌سیاه‌تبریل‌

‌: اشری‌آزدون‌ صورت‌زی ‌د د احل‌رو ‌در‌د حله

‌کانریر‌و‌کلمات‌پ سش کلمات‌‌تصاوی ‌دجموعهسازی‌ا عاد‌ن دال (0

اعمال‌فیلم ‌گوس ‌و‌تبریل‌تصاوی ‌ این ی‌ ه‌تصاوی ‌سطح‌خاکسم ی‌ (4

های‌فیش ‌تصاوی ‌اسمخ اج‌ویژگ (9

‌Wتصاوی ‌از‌فضای‌ویژگ ‌ ه‌فضای‌دشخصه‌ ا‌ض ب‌در‌دات یس‌تعبیه (5

Ux ه‌فضای‌ داری‌دشم ک‌ ا‌ض ب‌در‌دات یس‌دشخصهتصاوی ‌از‌فضای‌‌تعبیه (5

‌PHOCی‌دمن ‌کلمات‌پ سش ‌در‌فضای‌ چسب‌ ا‌اسمفاده‌از‌رشمه‌تعبیه (5

Vxی‌دشم ک‌ ا‌ض ب‌در‌دات یسداراز‌فضای‌ چسب‌ ه‌فضای‌ ‌PHOCهای چسب‌تعبیه (7

ی‌پ سش ‌های ‌که‌ ه‌کلمهدجموعه‌کلمات‌کانریر،‌نمونه ین‌از‌‌ی‌ داری‌دشم ک،در‌فضا (0

.شونرت ‌هسمنر‌دشخص‌د نزدی دوردنظ ‌

ازریا ‌ی‌د حلهانجام‌ (2

یابی رزروش ا 1-2-4

ی‌ ازشناس ‌تمام‌تصاوی ی‌که‌در‌فضای‌ داری‌ یان‌شر‌در‌د حلهدر‌فصل‌سوم‌همان‌طور‌که‌

و‌هرف‌تعیین‌‌گذاری‌شره‌و‌کلاس‌د وط‌ ه‌آنسا‌دشخص‌استدشم ک‌ق ار‌دارنر‌از‌قبل‌ چسب

‌ اشری‌پ سش ‌د کلاس‌د وط‌ ه‌کلمه نریر‌دارای‌ چسب‌دجموعه‌کلمات‌کارو ‌ول ‌در‌این‌.

-گذاری‌د و‌فقط‌کلمات‌پ سش ‌ چسب ه‌عبارت ‌کلاس‌د وط‌ ه‌آنسا‌دشخص‌نیست‌‌،نیسمنر

ارزیا ‌ ای‌ه ‌دو‌رو ‌‌.است‌]55[‌های‌این‌رو ‌ ا‌رو ‌ ازشناس این‌دساله‌یک ‌از‌تفاوت.‌شونر

ای‌ی ‌‌تصوی رو ‌ارزیا ‌ ای‌پ سش‌ ا‌‌.شودی‌دمن ‌انجام‌د پ سش‌ ا‌تصوی ‌و‌پ سش‌ ا‌رشمه

Page 83: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

55

‌:شادل‌د احل‌زی ‌است‌ی‌پ سش کلمه

در‌دجموعه‌کلمات‌کانریر،‌تصاوی ی‌ی‌پ سش ،‌ ای‌ه ‌کلمهلازم‌است‌ا مرا‌ ای‌انجام‌ارزیا

دشخص‌(‌ی‌دورد‌نظ ‌ اشنرتصاوی ی‌که‌فقط‌شادل‌کلمه)‌های‌آن‌کلمه‌در‌دمن‌هسمنرنمونهکه‌

‌شونر .‌ ‌داخل‌دمن ‌در ‌این‌تصاوی ‌شادل‌دخمصات‌دخمصات‌دکان ‌گوشهکه ‌ الا ه ‌ی‌سمت‌چپ

‌ع ض‌د ‌طول‌و ‌تصوی ، ‌است اشر ‌شره ‌قبل‌ذخی ه ‌از ‌این‌تصاوی . دمناسب‌ ا‌‌صحیح‌تصاوی ‌، ه

‌.شودگفمه‌د ‌ی‌پ سش کلمه

‌‌01از‌نظ ‌دکان ‌ی‌کانریر،دجموعه‌درای‌کلمه‌در‌این‌رو ‌ف ض‌ ‌این‌است‌که‌اگ ‌تصوی

-وی ‌صحیح‌تطبیق‌داشت‌و‌ ه‌عنوان‌خ وج ‌سیسمم‌آشکار‌شره‌ ود‌ ه‌عنوان‌گزینهاتصاین‌ ا‌درصر‌

،‌دجموعه‌تصاوی ‌تطبیق ‌درصر‌تطبیق‌هسمنر‌01 ه‌این‌تصاوی ‌که‌دارای‌.‌ی‌درست‌پذی فمه‌شود

‌.شونرهای‌تطبیق ‌آن‌هم‌دشخص‌د دمن‌پنج ه‌دردر‌واقع‌ ه‌ازای‌ه ‌تصوی ‌صحیح‌‌.شودگفمه‌د

در‌ی ‌ف دی‌است،‌اسمخ اج‌شره‌از‌دمن‌دارای‌شماره‌دنحص هتصاوی ‌ ا‌توجه‌ ه‌اینکه‌ه ‌کرام‌از‌

‌د شماره‌، دار ‌تطبیق ‌ذخی ه ‌تصاوی ‌و ‌صحیح ‌این‌تصوی ‌ دار‌‌شونری‌د وط‌ ه ‌ دار، ‌این ه

ی‌پ سش ‌در‌های ‌که‌از‌ی ‌کلمهاین‌است‌که‌ ه‌تعراد‌نمونهنکمه‌قا ل‌توجه‌‌.شودصحیح‌گفمه‌د

‌ دار‌صحیح‌ رست‌د ‌آیردمن‌وجود‌دارد، ی‌پ سش ‌ ا‌کلمهصحیح‌دنماظ ‌‌تصوی 4-‌5شکل‌‌در.

‌.‌(تصوی ‌صحیح‌ ا‌ یض ‌دشخص‌شره‌است)دشخص‌است‌‌ ا‌آن‌تصاوی ‌تطبیق ‌دمناظ و‌‌"کشور"

ی‌کشورتصوی ‌صحیح‌و‌تطبیق ‌دمناظ ‌ ا‌کلمه :4-‌5شکل‌

Page 84: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

55

دجموعه‌تصاوی ‌ه ‌ی ‌از‌‌تصوی ‌آن‌ ا‌،‌فاصلهی‌پ سش ای‌ه ‌کلمهدر‌فضای‌ داری‌دشم ک‌

Iϕپ سش ‌دورد‌نظ ‌در‌دات یس‌ی‌د وط‌ ه‌کلمهفاصله‌ ین‌سمون‌)‌.شودکلمات‌کانریر‌دحاسبه‌د

‌دات یس‌ ‌د Iϕ ا ‌(شوددحاسبه ‌را طه. ‌ ا ‌فاصله ‌شره‌ (0-5)ی‌سپس‌این ‌ی ‌ن دال ‌تا ‌صف ین

ی‌آن‌ ه‌ی ‌فاصلهی‌پ سش ‌نزدیکم ‌ اشر‌ ه‌کلمه‌تصوی ‌دوجود‌در‌دجموعه‌کانریر طوریکه‌ه چه‌

های‌آن‌ ا ‌سط ی‌است‌که‌تعراد‌سمونی ‌ دار‌‌ دار‌فاصله‌در‌این‌را طه.‌نزدیکم ‌است‌و‌ عکس

و‌‌‌ min.‌دهری‌پ سش ‌را‌نشان‌د فاصله‌ ا‌کلمه‌،ه ‌سمون.‌ی‌کانریر‌است ا‌تعراد‌کلمات‌دجموعه

maxاشنرد دار‌این‌دقرار‌در یشم ین‌و‌کمم ین‌ ا ‌ ا‌ ه‌ت تیب‌‌ .‌

(5-0)‌

‌:شونری‌ عری‌سه‌پارادم ‌زی ‌تع یف‌د در‌د حله

n‌:ی‌پ سش ‌دورد‌نظ ‌در‌دمن‌وجود‌دارنرهای ‌که‌از‌کلمهتعراد‌نمونه‌.‌

r‌:انری‌پ سش ‌آشکار‌شرهی‌کلمهکلمات ‌که‌ ه‌درسم ‌ ه‌عنوان‌نمونهتعراد‌‌.‌

:Nانری‌پ سش ‌دورد‌نظ ‌آشکار‌شرهتعراد‌کل‌کلمات ‌که‌ ه‌عنوان‌کلمه‌.

تصاوی ‌ت ین‌نزدی ی‌فاصله ا‌توجه‌ ه‌اینکه‌‌. دار‌صحیح‌وجود‌دارد‌n ا‌توجه‌ ه‌توضیحات‌ الا‌

صورت‌‌(Distance)فاصله‌دات یس‌،‌نزدی ‌ ه‌ی ‌استی‌پ سش ‌ ه‌کلمه‌کانریر‌کلماتدجموعه‌

.‌آیر رست‌د ‌دجموعه‌کلمات‌کانریر‌نزول ‌د تب‌شره‌و‌دمناسب‌ ا‌آن‌ داری‌شادل‌شماره‌تصاوی

0رتبه دار‌صحیح،‌‌nی‌این‌ دار‌ ا‌ه ‌ی ‌از‌ ا‌دقایسهدمناسب‌ ا‌تصوی ‌صحیح‌و‌تصاوی ‌تطبیق ‌

‌ ‌دشخص‌د ای ‌نمونه ‌شوده .‌ ‌رتبه ‌دهنرهنشاناین ‌که ‌است ‌این ‌وی ‌صحیح تطبیق ‌ تصاوی

1 Rank

Page 85: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

57

‌ ‌‌ی‌پ سش کلمهی‌نمونهدمناسب‌ ا ‌دمن ‌کلمهدر ‌نزدی ‌ ه ‌چنردین‌تصوی ‌عنوان ی‌پ سش ‌ ه

‌.‌شودد ‌ ه‌عنوان‌ سم ین‌حالت‌در‌نظ ‌گ فمه‌رتبهت ین‌پایین‌.انرتشخیص‌داده‌شره

‌د حله ‌در ‌ عری ‌شره آسمانه‌09ی ‌گ فمه ‌نظ ‌آسمانه‌،در ‌ ه ‌توجه ‌ ا ‌ ار ‌ه ‌و ‌نظ ی ‌،دورد

‌‌فاصلهکه‌‌صاوی یت ی‌ ه‌عنوان‌تصاوی ‌آشکار‌شره‌از‌این‌آسمانه‌ یشم ‌ اشری‌پ سش ‌تا‌کلمهآنسا

رتبه‌ت ین‌،‌پایینr ای‌ رست‌آوردن‌‌.است‌‌Nهمانکلمات‌این‌تعراد‌.‌شونرسیسمم‌در‌نظ ‌گ فمه‌د

هسمنر‌کمم ‌‌Nهای ‌که‌از‌رتبهدر‌نظ ‌گ فمه‌شره‌و‌تعراد‌‌ی‌پ سش ‌در‌دمن ای‌ه ‌نمونه‌از‌کلمه

‌. اشرد ‌r ا ‌ ا‌

‌اولین‌آسمانه ‌ ا ‌ ا ‌نظ ‌گ فمه‌شره ‌کم‌‌ی‌دیگ آسمانه‌09است‌و‌‌2245/1ی‌در ه‌ت تیب‌ ا

‌آسمانه ‌از ‌ی‌قبل ‌شرن ‌‌آینر رست‌د ‌‌1045/1دیزان ه ‌ ا ‌ ا ‌آخ ین‌آسمانه ‌0545/1 طوریکه

در‌.‌شونرکه‌در‌ه ‌آسمانه‌دحاسبه‌د انرشرهزی ‌تع یف‌‌هایدعیار‌رو کارای ‌ ای‌ارزیا ‌‌.است

‌:شود یان‌د از‌این‌دعیارها‌ی‌ه ‌ی ‌اداده‌رو ‌دحاسبه

0دقت( 4‌،‌در‌تماد ‌تحقیقات‌صورت‌گ فمه‌در‌این‌زدینهی‌پ سش کلمهدقت‌تشخیص‌ی ‌‌:

‌.شوددحاسبه‌د (‌4-5)ی‌طبق‌را طه

(5-4)‌

دثال‌زی ‌‌دراین‌دساله‌.‌در‌این‌تحقیق‌ ه‌دلیل‌وجود‌تصاوی ‌تطبیق ‌این‌دعیار‌نیاز‌ ه‌اصلاح‌دارد

‌‌:شره‌است‌توضیح‌داده

است‌و‌دو‌نمونه‌از‌این‌کلمه‌‌"صنعت"ی‌پ سش ‌ورودی‌در‌این‌دثال‌ف ض‌شره‌است‌که‌کلمه

1 Precision(P)

Page 86: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

50

‌04تا‌‌0اعراد‌.‌را‌آشکار‌ک ده‌است 9-‌5شکل‌ی‌دوجود‌در‌کلمهN=12 سیسمم‌‌.در‌دمن‌وجود‌دارد

ای‌که‌ ا‌ یض ‌دشخص‌در‌این‌دثال‌دو‌کلمه.‌دهررا‌نشان‌د ‌آشکار‌شره‌د وط‌ ه‌این‌کلمات‌رتبه

‌نمونه ‌دو ‌کلمههسمنر، ‌ ا ‌‌ اشنری‌پ سش ‌د ی‌صحیح‌دمناظ ‌دسمطیل‌دشخص‌و ‌ ا کلمات ‌که

‌9‌،2د وط‌ ه‌ی ‌نمونه‌و‌کلمات‌‌5و‌‌0‌،4‌،5تبهکلمات‌ ا‌ر.‌انر‌کلمات‌تطبیق ‌دمناظ ‌هسمنرشره

‌. اشنردر‌دمن‌د ‌"صنعت"ی‌دیگ ‌د وط‌ ه‌نمونه‌01و‌

"صنعت"ی‌کلمات‌آشکار‌شره‌توسط‌سیسمم‌ ای‌کلمه:‌9-‌5شکل‌

اشیر‌در‌نظی ‌گ فمیه‌‌‌‌دی ‌‌9و‌0 ای‌ه ‌نمونه‌که‌‌رتبهت ین‌،‌پایینrیدر‌این‌حالت‌ ای‌دحاسبه

در‌این‌سیسیمم‌کلمیات‌‌‌.‌است‌r=2 کوچکم ‌هسمنر‌پس‌در‌نمیجه‌‌04شره‌و‌چون‌ه ‌دو‌این‌اعراد‌از‌

،‌‌5‌،7‌،0تبه ا‌ر‌کلمه‌5در‌این‌حالت‌فقط‌‌.شونر ه‌عنوان‌خطا‌در‌نظ ‌گ فمه‌نم تطبیق ‌آشکار‌شره‌

یه‌عنیوان‌دیواردی‌اشیمباه‌‌‌‌‌‌ اشینر‌د ‌"صورت"و‌‌"وضعیت"ا ه‌ی‌دشکه‌د وط‌ ه‌دو‌کلمه‌04و‌‌00

کیاهش‌پییرا‌‌‌‌7 یه‌‌‌04ی‌دقت‌تعراد‌کلمات‌آشکار‌شره‌از‌انر‌ ه‌همین‌دلیل‌ ای‌دحاسبهآشکار‌شره

-5) یصورت‌زی ‌تع یف‌شره‌که‌دعیار‌دقت‌ ا‌توجه‌ ه‌آن‌ ا‌را طیه‌در‌واقع‌پارادم ‌جریری‌ ه‌.‌کنرد

‌:شوداصلاح‌د (9

N' : شره‌ ‌تصاوی ‌تطبیق ‌آشکار ‌شره‌دنسای‌تعراد ‌کلمه‌تعراد‌کل‌کلمات‌آشکار ی‌دمناظ ‌ ا

پ سش

21 3 4

5

78

9 10 11 12

6

Page 87: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

52

(5-9)‌P

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌‌‌‌

0فراخوانی(4 .شوددحاسبه‌د ‌(5-5)‌یی‌پ سش ‌از‌را طهف اخوان ‌ی ‌کلمه‌:

(5-5)‌R

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌‌‌‌

اشیر‌‌اگی ‌دقیت‌ یالا‌‌‌‌‌زیی ا‌.‌کنیر‌‌د ‌را‌دنعکس‌دقت‌و‌ف اخوان ‌توازن‌ ین‌این‌دعیار‌: F1نرخ (3

هیای ‌دناسیب‌‌‌رو ‌.رود‌یر‌نی خ‌ف اخیوان ‌ یالات ‌دی ‌‌‌‌آکنر‌و‌اگ ‌دقت‌پایین‌‌ف اخوان ‌کاهش‌پیرا‌د

.‌ یشیم ین‌دقیرار‌را‌دارد‌‌‌‌F1هسمنر‌که‌دیزان‌دقت‌و‌ف اخوان ‌آنسا‌در‌ی ‌حر‌ اشر‌که‌در‌این‌حالت‌

همیان‌آسیمانه‌ یه‌عنیوان‌ سمی ین‌‌‌‌‌‌‌،ای‌که‌ یشم ین‌دقرار‌را‌داشمه‌ اشردر‌ه ‌آسمانه F1از‌این‌رو‌ن خ‌

.شوددحاسبه‌د (‌5-5)ی‌ ا‌را طه ‌F1.شودآسمانه‌در‌نظ ‌گ فمه‌د

(5-5)‌

.‌شیود‌دحاسیبه‌دی ‌‌ در‌هی ‌آسیمانه‌‌‌F1ف اخیوان ‌و‌‌‌ی‌پ سش ‌در‌ی ‌دمن‌دقت، ای‌ه ‌کلمه‌‌

ی ای‌تمیام‌کلمیات ‌کیه‌دارای‌‌‌‌‌.‌شونری‌پ سش ‌ذخی ه‌د سپس‌این‌اطلاعات‌ ه‌هم اه‌ چسب‌کلمه

هیا‌‌هسمنر،‌در‌واقع‌کلمات ‌که‌د وط‌ ه‌ی ‌کلاس‌هسمنر،‌در‌ه ‌آسیمانه،‌ایین‌دعییار‌‌‌ چسب‌دشا ه‌

ای‌حاصل‌شود‌که‌کیلاس‌کلمیات‌همیه‌از‌هیم‌دمفیاوت‌‌‌‌‌‌تا‌در‌نسایت‌دجموعه.‌شونرگی ی‌د دیانگین

‌‌‌‌.شودگی ی‌د اشنر‌و‌ ای‌ارزیا ‌کل ،‌در‌ه ‌آسمانه‌در‌این‌دجموعه‌دیانگین

5)4FP‌:ی‌پ سش ‌دورد‌نظ ‌نبوده‌ول ‌سیسمم‌شود‌که‌کلمهتعراد‌کلمات ‌تع یف‌د ه‌صورت‌

)‌FP=5در‌دثال‌ الا‌(‌. اشرد N'-rاین‌تعراد‌ ا ‌ ا‌.‌آن‌را‌آشکار‌ک ده‌است

1 Recall(R)

2 False Positive

Page 88: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

71

5)0FN: ی‌پ سش ‌در‌دمن‌هسمنر‌ای‌از‌کلمهشود‌که‌نمونه ه‌صورت‌تعراد‌کلمات ‌تع یف‌د

‌(FN=0در‌دثال‌ الا‌)‌. اشرد n-rاین‌تعراد‌ ا ‌ ا‌.‌انرول ‌توسط‌سیسمم‌آشکار‌نشره

5)TP4

ی‌پ سش ‌در‌دمن‌هسمنر‌و‌ی‌از‌کلمهشود‌که‌نمونه ه‌صورت‌تعراد‌کلمات ‌تع یف‌د ‌:

‌(TP=2در‌دثال‌ الا‌)‌. اشرد ‌rاین‌تعراد‌ ا ‌ ا‌.‌انرتوسط‌سیسمم‌آشکار‌شره

7)TN9

‌دجموعه‌شود ه‌صورت‌تعراد‌کلمات ‌تع یف‌د ‌: ‌نمونهکه‌در ‌کلمهی‌کانریر، ی‌ای‌از

های‌تطبیق ،‌ ا‌توجه‌ ه‌وجود‌پنج ه‌.پ سش ‌دورد‌نظ ‌نبوده‌و‌توسط‌سیسمم‌هم‌آشکار‌نشره‌است

دنماظ ‌ ا‌تعراد‌کل‌تصاوی ‌تطبیق ‌‌از‌ی‌کانریر‌وجود‌داردکه‌در‌دجموعه‌کلمات تعراد‌کل‌ ایر‌ا مرا‌

-5) یاز‌را طه‌TNتعراد‌‌در‌نظ ‌گ فمه‌شود،(‌'W)که‌اگ ‌این‌تعراد‌ ا ‌ ا‌‌دشوکم‌ی‌پ سش ‌کلمه

.شوددحاسبه‌د (5

(5-5)‌TN= W '-FP-TP-FN

دع فی ‌‌ 0-‌5جیرول‌‌این‌دعیارها‌در‌.‌شونردحاسبه‌د ‌‌FPو‌ TN،‌TP، FNدیگ ‌توسط‌‌هایدعیار

‌.‌انرشره

‌تع یف‌دعیارها:‌0-‌5جرول‌

NPV=TN/TN+FN‌Nagative Predictive Value‌

SPC=TN/TN+FP‌Specificity or true negative rate

ACC=TP+TN/TP+FP+FN+TN‌Accuracy‌

‌رشمه ‌رو ‌پ سش‌ ا ‌و ‌تصوی ‌تفاوت‌رو ‌پ سش‌ ا ‌تنسا ‌این‌است‌که ‌رو ‌ی‌دمن ‌در در

آن،‌ ا‌ چسب‌ ین‌‌ی‌پ سش ،‌فاصلهدر‌فضای‌ داری‌دشم ک‌ ای‌ه ‌کلمهی‌دمن ،‌پ سش‌ ا‌رشمه

1False Negative 2 True Positive‌

3 True Negative

Page 89: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

70

‌.شودهای‌دجموعه‌کلمات‌کانریر‌دحاسبه‌د تصوی ‌ه ‌ی ‌از‌نمونه

ی کاندید مجموعه کلمات در روش پیشنهادی برای کاهش 1-2-2

ی‌ی‌پ سش ‌ ا‌تمام‌کلمات‌دوجود‌در‌دجموعهدر‌ خش‌قبل ‌ یان‌شر‌ه ‌کلمهطور‌که‌همان

‌تعراد‌ح وف‌‌ت ‌کاهش‌دجموعهول ‌رو ‌دناسب.‌شودکانریر‌دقایسه‌د کلمات‌کانریر‌دمناسب‌ ا

-یا‌ح وف‌اضافه‌"سه"یا‌‌"سال"های‌پ سش ‌داننر‌کلمه ه‌طور‌دثال‌ ای‌.‌ی‌پ سش ‌استه ‌کلمه

‌"دسئولیت"‌یا "سالیانه" اشنر،‌دقایسه‌ ا‌کلمات ‌دثل‌که‌دارای‌دو‌ح ف‌د ‌" ا"یا‌‌"در"ای‌داننر‌

‌.که‌دارای‌هفت‌ح ف‌هسمنر‌دنطق ‌نیست

‌ ‌فصل ‌در ‌تصوی ی‌که ‌کلمات ‌‌5رو ‌اسمخ اج ‌شر ‌خواهر ‌پایه یان ‌دولفه های‌ی‌اسمخ اج

‌ ا‌در‌نظ ‌گ فمن‌این‌قانون‌که‌اکث ‌ح وف‌اضافه‌و‌کلمات‌فارس ‌از‌ت کیب‌این‌رو در‌.‌مصل‌استد

در‌این‌رو ‌‌.شود‌انر‌اسمخ اج‌کلمات‌از‌داخل‌دمن‌انجام‌د ‌دمصل‌تشکیل‌شره‌ی‌تا‌هفت‌دولفه‌ی

‌.استنیز‌دشخص‌های‌دمصل‌آن‌شود‌تعراد‌دولفهای‌که‌اسمخ اج‌د دمناسب‌ ا‌ه ‌تصوی ‌کلمه

‌توجه‌ ه‌این‌دساله‌ های‌تعراد‌دولفه‌،ی‌کانریر ای‌تمام‌کلمات‌پ سش ‌و‌کلمات‌دجموعه‌، ا

‌ ‌گ فمه ‌نظ ‌در ‌عنوان‌ی ‌پارادم ‌ ه ‌نیز ‌شودد دمصل‌آنسا ‌دولفه. ‌تعراد ‌ف ض‌اینکه های‌دمصل‌ ا

‌کلمه ‌ ا ‌اید حله‌ اشر‌NCCی‌پ سش ‌ورودی‌ ا ‌ ه ‌کلمات‌کانریر ن‌صورت‌ی‌کاهش‌دجموعه

‌:‌شودانجام‌د

1اگ ‌NCC=دجموعه‌‌ ‌از ‌کلمات ‌انمخاب‌د اشر ‌دقایسه ‌ ای ‌تعراد‌ی‌کانریر ‌که شونر

. اشر‌9تا‌‌0آنسا‌ ین‌های‌دمصل‌دولفه

2اگ ‌NCC=دجموعه‌‌ ‌از ‌کلمات ‌انمخاب‌د اشر ‌ ای‌دقایسه ‌تعراد‌ی‌کانریر ‌که شونر

. اشر‌5تا‌‌0آنسا‌ ین‌های‌دمصل‌دولفه

Page 90: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

74

6اگ ‌NCC=دجموعه‌‌ ‌از ‌کلمات ‌انمخاب‌د اشر ‌دقایسه ‌ ای ‌تعراد‌ی‌کانریر ‌که شونر

. اشر‌7تا‌‌5آنسا‌ ین‌های‌دمصل‌دولفه

7اگ ‌NCC=دجموعه‌ اشر‌‌ ‌از ‌انمخاب‌د کلمات ‌ ای‌دقایسه ‌تعراد‌ی‌کانریر ‌که شونر

. اشر‌7تا‌‌5آنسا‌ ین‌های‌دمصل‌دولفه

‌ 3اگ<=NCC<=5شونر‌که‌تعراد‌ی‌کانریر‌ ای‌دقایسه‌انمخاب‌د اشر‌کلمات ‌از‌دجموعه‌

.ق ار‌گی د [NCC-2,NCC+2] ی‌های‌دمصل‌آنسا‌در‌ ازهدولفه

‌.شوداسمفاده‌از‌این‌رو ‌ اعث‌کاهش‌حجم‌دحاسبات‌د

ی جستجوی کلماتمرحله نتایج 1-2-9

دمن‌دمفاوت‌انمخاب‌شره‌اسیت‌کیه‌از‌‌‌نوع‌‌FHT‌،01ی‌ی‌ارزیا ‌از‌پاپگاه‌داده ای‌انجام‌د حله

سینر‌‌‌011 ی ای‌ارزییا ‌ایین‌رو ‌از‌‌‌‌‌ یه‌‌طیور‌کلی ‌‌‌.‌خط‌دمفاوت‌وجیود‌دارد‌دست01ه ‌نوع‌دمن،

‌: اشرجزئیات‌د وط‌ ه‌تعراد‌کلمات‌پ سش ‌ ه‌صورت‌زی ‌د .‌شره‌استتصوی ی‌اسمفاده‌

دیمن‌انمخیا ‌‌‌‌01.‌انری‌دممایز‌ ه‌عنوان‌کلمات‌پ سش ‌انمخاب‌شرهکلمه‌55ای‌شادل‌دجموعه

دارای‌دوضوعات‌تق یبا‌دشا س ‌هسمنر‌تا‌ف اوان ‌کلمات‌پ سش ‌داخل‌آنسا‌زیاد‌ اشر‌ ه‌همیین‌دلییل‌‌‌

‌45در‌دجموع‌تعراد‌ایین‌‌.‌انراز‌ی ‌دمن‌ظاه ‌شرهکلمه‌در‌ یشم ‌‌45ی‌کلمات‌پ سش ،‌در‌دجموعه

،‌(کلمه‌90)لمه‌و‌تعراد‌کلمات‌دممایزک‌70 ا‌در‌نظ ‌گ فمن‌این‌.‌ اشرد ‌70دمن،‌‌01کلمه‌در‌داخل‌

ی ای‌هی ‌کیرام‌از‌ایین‌‌‌‌‌.‌ اشرد ‌‌012،دمن‌در‌نظ ‌گ فمه‌شره‌01کلمات‌پ سش ‌که‌ ای‌کل‌تعراد‌

ی ‌کلمه‌در‌داخل‌ی ‌‌ف اوان یشم ین‌.‌خط‌دمفاوت‌وجود‌دارددستسنر‌ ا‌‌01کلمه‌،‌حراقل‌‌012

یا‌در‌‌.‌دهیر‌را‌نشان‌د ‌7تا‌‌0تعراد‌کلمات‌ ا‌ف اوان ‌ ین‌‌4-‌5جرول‌‌.و‌کمم ین‌آن‌ی ‌است‌7دمن‌

کیه‌ایین‌‌‌سنر‌وجود‌دارد‌‌011کلمه‌در‌این‌نمونه‌‌0001کلمات،‌ ه‌طور‌کل ‌‌نظ ‌گ فمن‌تعراد‌ف اوان

هیای‌کلمیات‌پ سشی ‌در‌دیمن‌ ا ی ‌ یا‌‌‌‌‌‌‌دموسیط‌تعیراد‌نمونیه‌‌‌ .پ داخمه‌استرو ‌ ه‌جسمجوی‌آنسا‌

نمونیه‌از‌کلمیات‌پ سشی ‌دوجیود‌در‌‌‌‌‌‌0451این‌الگوریمم‌در‌رو ‌پ سش‌ ا‌تصوی ،‌‌. اشرد 5550/0

Page 91: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

79

ی‌ اشر‌و‌در‌رو ‌پ سش‌ یا‌رشیمه‌‌د %‌‌52اول‌آشکار‌ک ده‌است‌که‌دعادل‌ ا‌‌رتبهرا‌اسناد‌تصوی ی‌

%‌‌74اول‌شره‌است‌کیه‌دعیادل‌ یا‌‌‌‌‌رتبهنمونه‌از‌کلمات‌پ سش ‌در‌‌0904سازی‌دمن ‌دوفق‌ ه‌آشکار

اشینر‌ یه‌‌‌ی‌کلمیه‌دمنیوع‌دی ‌‌‌ی‌کلمات‌پ سش ‌از‌جست‌تعراد‌ح وف‌تشکیل‌دهنیره‌هدجموع.‌است

،‌کلمیات‌ یا‌تعیراد‌حی وف‌‌‌‌‌"دو"و‌‌"شر"،‌"در"،‌"دا"طوری‌که‌شادل‌کلمات ‌ ا‌تعراد‌ح وف‌کم‌دثل‌

،‌"دیری یت‌"و‌کلمیات ‌ یا‌تعیراد‌حی وف‌زییاد‌دثیل‌‌‌‌‌‌‌‌"درآدر"و‌‌"د دم"،‌"کشور"،"دارو"دموسط‌دثل

‌.است‌"دسمقیم"و‌‌"اتاقراد‌"،"اولویت"

7تا‌‌0 ین‌‌تعراد‌کلمات‌ ا‌ف اوان :‌4-‌5جرول‌

های‌تعراد‌نمونه

‌کلمات‌در‌دمن

0‌4‌9‌5‌5‌5‌7‌

‌‌57‌47‌7‌5‌4‌0‌0تعراد‌کلمات

‌ینوشیمه‌دسیت‌‌سنر‌011 ‌روی‌‌0-4-5در‌ خش‌دموسط‌دعیارهای‌تع یف‌شره‌‌9-‌5جرول‌در‌

در‌ایین‌جیراول‌پینج‌‌‌‌‌.داده‌شره‌استی‌دمفاوت‌نشان‌هاآسمانهدر‌‌و‌دمن‌پ سش‌ ا‌تصوی ای‌فارس ‌

.انرسیزدهم‌در‌نظ ‌گ فمه‌شرهی‌یازدهم‌و‌ی‌اول‌و‌آسمانهآسمانه

Page 92: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

75

های‌دمفاوت‌ ای‌حالت‌پ سش‌ ا‌در‌آسمانهسنر‌دمن ‌‌011 ‌روی‌کارای ‌رو ‌دموسط‌دعیارهای‌‌ :9-‌5جرول‌

و‌دمن‌تصوی

Threshold Performance

Criterion

8125/9 0575/1‌3125/9 255/1‌2575/1‌20/1‌3325/9

50/52‌70/55‌15/75 27/75‌50/70‌25/72‌43/84

Precision

Q

B

E

17/39 07/20‌12/89 77‌52/79‌04/71‌12/57‌

Recall ‌

05/55‌05/51‌51/72 50/74‌25/70‌47/70‌50/71‌F1‌

54/50‌19/55‌28/89 92/00‌04/04‌01/04‌89

Precision‌

Q

B

S 41/39 70/21‌32/78 02/75‌55/79‌52/71‌95/57‌

Recall ‌

57/59‌14/52‌32/75 55/75‌57/75‌51/79‌54/70‌F1‌

ای‌که‌یا ر‌ ه‌گونهانر‌افزایش‌د ا‌کاهش‌آسمانه‌تعراد‌کل‌کلمات ‌که‌توسط‌الگوریمم‌آشکار‌شره

و‌در‌کمم ین‌آسمانه‌‌00/0در‌ یشم ین‌آسمانه‌دموسط‌این‌تعراد‌ ا ‌ ا‌ ای‌حالت‌پ سش‌ ا‌تصوی ،‌

یا ر‌و‌ یشم ین‌دقرار‌آن‌در‌ نا این‌ ا‌کاهش‌آسمانه،‌دموسط‌دقت‌کاهش‌د .‌است‌55/00 ا ‌ ا‌

‌ ‌ ا ‌ ا ‌که ‌حاصل‌شره ‌اول ‌است‌%02/00آسمانه ‌ ه‌. ‌کلمات ‌که ‌تعراد ‌کاهش‌آسمانه، همچنین‌ ا

افزایش‌داشمه‌و‌از‌تعراد‌کلمات ‌که‌(‌TP)‌انری‌پ سش ‌آشکار‌شرهای‌از‌کلمهدرسم ‌ ه‌عنوان‌نمونه

شود‌ ه‌کاسمه‌د (‌FN)‌ی‌پ سش ‌هسمنر‌ول ‌الگوریمم‌قادر‌ ه‌شناسای ‌آنسا‌نبودهای‌از‌کلمهنمونه

‌است%‌57/29ی‌آخ ‌حاصل‌شره‌و‌ ا ‌ ا‌ای‌که‌ یشم ین‌دقرار‌ف اخوان ‌در‌آسمانهگونه یشم ین‌.

اشر‌که‌در‌این‌آسمانه‌دیزان‌د ‌%55/74است‌که‌ ا ‌ ا‌‌ رست‌آدره‌2545/1ی‌در‌آسمانه‌F1دقرار‌

.شوداین‌آسمانه‌ ه‌عنوان‌ سم ین‌آسمانه‌انمخاب‌د .است%‌54/01و‌دیزان‌ف اخوان ‌‌%55/75دقت‌

‌ ‌دمن‌ یشم ین‌دقرار ‌آسمانه‌F1 ای‌حالت‌پ سش‌ ا ‌ ا‌‌2545/1ی‌در ‌ ا ‌است‌که رست‌آدره

در‌دقایسه‌.‌است‌%24/70و‌دیزان‌ف اخوان ‌%‌40/01انه‌دیزان‌دقت‌ اشر‌که‌در‌این‌آسمد 24/75‌%

Page 93: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

75

‌5/0افزایش‌و‌ف اخوان ‌ ه‌دیزان‌‌09/5و‌دقت‌ ه‌دیزان‌‌90/9 ه‌دیزان‌‌F1 ا‌حالت‌پ سش‌ ا‌تصوی ،‌

.کاهش‌یافمه‌است

.انرگزار ‌شره‌5-‌5جرول‌در‌‌NPVو‌‌SPC ‌،ACCسه‌دعیار

و‌‌های‌دمفاوت‌ ای‌حالت‌پ سش‌ ا‌تصوی در‌آسمانهسنر‌دمن ‌‌011 ‌روی‌دعیارهای‌کارای ‌رو ‌‌:5-‌5جرول‌

دمن

Threshold Performance

Criterion

0545/1‌0575/1‌3125/9 255/1‌2575/1‌20/1‌2245/1‌

25/20‌59/22‌83/33 20/22‌24/22‌29/22‌29/22‌ACC

Q

Q

B

E

29/20‌55/22‌32/33 25/22‌25/22‌27/22‌20/22‌SPC

22/22‌22/22‌37/33 27/22‌25/22‌25/22‌25/22‌NPV

29/20‌59/22‌32/33 29/22‌25/22‌25/22‌25/22‌ACC

Q

Q

B

S 25/20‌59/22‌31/33 25/22‌27/22‌20/22‌22/22‌SPC

22/22‌22/22‌37/33 27/22‌27/22‌25/22‌25/22‌NPV

‌است‌TNهای‌الگوریمم،‌ الا‌ ودن‌یک ‌از‌دزیت،‌5-‌5جرول‌ ا‌توجه‌ ه‌ ه‌عبارت‌دیگ ‌از‌ ین‌.

‌کلمه ‌عنوان‌دواردی‌که ‌ ه ‌کلمات‌را ‌زیادی‌از ‌است‌تعراد ‌قادر ‌الگوریمم ‌کلمات‌کانریر ی‌دجموعه

- زرگ‌د ‌NPVو‌‌SPC ه‌همین‌دلیل‌دقادی ‌.‌م ‌رد‌کنرانر‌ ه‌درسپ سش ‌دورد‌نظ ‌کار ‌نبوده

ی‌این‌است‌که‌تعراد‌دهنرهنشان‌SPC زرگ ‌،‌5-‌5جرول‌ ا‌توجه‌ ه‌دقادی ‌گزار ‌شره‌در‌‌. اشنر

‌درسم ‌ ‌ ه ‌توسط‌الگوریمم ‌اشمباها‌‌(TN)‌انرشرهن‌پذی فمهکلمات ‌که ‌کلمات ‌که ‌تعراد نسبت‌ ه

‌شره ‌د ‌(FP)‌انرآشکار ‌ زرگم ‌ اشر سیار ‌تغیی ات‌جزئ ‌دارد. ‌کاهش‌آسمانه ‌ ا زرگ ‌‌.این‌دعیار

NPVکلمهدهنرهنشان‌‌ ‌کلمات ‌که ‌تعراد ‌این‌است‌که ‌ ودهی‌پ سش ‌دوی ‌نظ ‌ول ‌توسط‌رد انر

انر‌شرهن‌پذی فمهالگوریمم‌ ه‌درسم ‌تعراد‌کلمات ‌که‌توسط‌نسبت‌ ه‌‌(FN)‌انرسیسمم‌آشکار‌نشره

Page 94: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

75

‌ اشر سیار‌انرک‌د .ACCنمایج‌دثبت‌تعراد‌دجموع‌‌نسبت‌(TPو‌‌TN‌ ی‌کانریر‌ ه‌کل‌دجموعه(

‌ اشرد .‌ ‌تق یبا ‌این‌آزدایشات‌این‌دعیار ‌ زرگ ‌آن‌نشان‌.است%‌‌22در ی‌این‌است‌که‌دهنرهکه

‌. اشرکم‌د (‌FTو‌FN)‌دجموع‌تعراد‌نمایج‌دنف

را‌ ی ای‌سیه‌‌‌(‌'N)‌و‌تعراد‌کلمات‌آشکار‌شرهTP‌،TN‌،FP‌، FNتعراد‌‌7-‌5جرول‌‌تا‌5-‌5جرول‌

ی‌پ سش ‌تعراد‌دجموعه‌کلمیات‌‌ ای‌ه ‌کلمه‌.دهردمفاوت‌نشان‌د های‌ی‌پ سش ‌در‌آسمانهکلمه

‌.هم‌گزار ‌شره‌است(‌'W)کانریر

‌(W'=1142)‌دل ی‌پ سش ‌ ای‌کلمهتعراد‌دعیارها‌:‌5-‌5جرول‌

Threshold Performance

Criterion 0545/1‌0575/1‌2545/1‌255/1‌2575/1‌20/1‌2245/1‌

5‌5‌9‌9‌4‌0‌0‌N'

5‌5‌9‌9‌4‌0‌0‌TP‌

0090‌0090‌0090‌0090‌0090‌0090‌0090‌TN ‌

1‌1‌1‌1‌1‌1‌1‌FP

1‌1‌0‌0‌4‌9‌9‌FN

Page 95: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

77

(W'=1868)ی‌پ سش ‌ ای‌دعیارها‌ ای‌کلمهتعراد‌‌:5-‌5جرول‌

Threshold Performance

Criterion 0545/1‌0575/1‌2545/1‌255/1‌2575/1‌20/1‌2245/1‌

5‌5‌4‌4‌4‌4‌0‌N'

4‌4‌4‌4‌4‌4‌0‌TP‌

0055‌0055‌0055‌0055‌0055‌0055‌0055‌TN ‌

4‌4‌1‌1‌1‌1‌1‌FP

1‌1‌1‌1‌1‌1‌0‌FN

(W'=1652)‌تولیری‌پ سش ‌دعیارها‌ ای‌کلمهتعراد‌‌:7-‌5جرول‌

Threshold Performance

Criterion 0545/1‌0575/1‌2545/1‌255/1‌2575/1‌20/1‌2245/1‌

9‌9‌9‌4‌0‌0‌0‌N'

9‌9‌9‌4‌0‌0‌0‌TP‌

0552‌0552‌0552‌0552‌0552‌0552‌0552‌TN ‌

1‌1‌1‌1‌1‌1‌1‌FP

1‌1‌1‌0‌4‌4‌4‌FN

-تعیراد‌کمی ‌دی ‌‌‌‌FNو‌FPو‌تعیراد‌‌زیاد‌‌TNدشخص‌است،‌تعراد‌این‌جراول‌‌درهمان‌طور‌که‌

‌.‌دهرکه‌این‌دسئله‌کارای ‌الگوریمم‌را‌نشان‌د ‌ اشنر

‌که‌دارای‌ یشم ین‌دموسط‌دقت‌در‌دجموعیه‌ی‌پ سش ‌کلمه‌سیزده‌،‌5-‌5شکل‌‌و‌5-‌5شکل‌در‌

Page 96: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

70

ی‌سیمون‌اول‌د یوط‌ یه‌تصیوی ‌کلمیه‌‌‌‌‌هیا،‌‌در‌ایین‌شیکل‌‌.‌انرکلمات‌پ سش ‌هسمنر‌نشان‌داده‌شره

انیر‌نمیایش‌داده‌‌‌توسط‌الگوریمم‌آشکار‌شیره‌که‌‌اول ‌تصوی ‌پنج‌،در‌سمون‌دوم‌تا‌ششم.‌استپ سش ‌

یین‌‌‌ازهیای‌کلمیات‌پ سشی ‌‌‌‌همان‌طور‌که‌دشخص‌است‌الگوریمم‌دوفق‌ ه‌یافمن‌نمونیه‌.‌شره‌است

‌را‌روی‌و‌ف اخیوان ‌‌دموسیط‌‌سمون‌هفمم‌و‌هشمم‌ ه‌ت تییب‌دقیت‌‌.‌کلمات‌کانریر‌شره‌است‌دجموعه

‌دیورد‌ی‌در‌آسیمانه‌د‌کلمات‌آشیکار‌شیره‌‌‌دموسط‌تعرا‌.دهرنشان‌د ‌دورد‌نظ ‌ی‌پ سش کلمه‌کلاس

ی‌پ سشی ‌‌ ه‌همین‌دلیل‌تشخیص‌تصاوی ‌صحیح‌و‌تطبیق ‌دمنیاظ ‌ یا‌کلمیه‌‌‌.‌است‌0/4 ا ‌ ا‌‌نظ

در‌دورد‌کلمیات‌پ سشی ‌‌‌.‌شود ین‌سه‌تصوی ‌اول‌آشکار‌شره‌توسط‌الگوریمم‌دوجب‌افزایش‌دقت‌د

‌.این‌دساله‌ ق ار‌است‌5-‌5شکل‌و‌‌5-‌5شکل‌

‌. اشنرکلمات‌پ سش ‌که‌دارای‌ الات ین‌دقت‌دموسط‌د :5-‌5شکل‌

‌‌‌‌

‌. اشنرکلمات‌پ سش ‌که‌دارای‌ الات ین‌دقت‌دموسط‌د :‌5-‌5شکل‌‌‌‌‌‌‌

Query Rank1 Rank2 Rank3 Rank4 Rank5 P R

94.17 80

89.92 96.67

82.5

95 100

95 100

85 77.5

95

Query Rank1 Rank2 Rank3 Rank4 Rank5RP

100 65

100 75

95 90

95 90

93.33 100

93.33 100

90 90

Page 97: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

72

در‌یی ‌‌‌7تیا‌‌‌9ی‌ یین‌‌،‌کلمات ‌که‌چنر‌ ار‌در‌دمن‌ظاه ‌شره‌و‌دارای‌تعراد‌نمونه5-‌5شکل‌در‌

تصیوی ‌اولی ‌اسیت‌کیه‌توسیط‌‌‌‌‌‌سمون‌ی ‌تا‌هفت‌د وط‌ ه‌هفت‌.‌انر اشنر‌نمایش‌داده‌شرهد دمن‌

همیان‌‌.‌دهیر‌های‌ی ‌کلمه‌در‌دیمن‌را‌نشیان‌دی ‌‌‌سمون‌هشمم‌تعراد‌نمونه.‌است الگوریمم‌آشکار‌شره

ی‌پ سشی ‌دوجیود‌در‌دیمن‌‌‌‌های‌کلمیه‌طور‌که‌دشخص‌است‌الگوریمم‌قادر‌ ه‌آشکارسازی‌تمام‌نمونه

‌.انردشخص‌شره‌کادر‌دسمطیل ها‌ ا‌این‌نمونه.‌شره‌است

ی‌پ سش ‌دوجود‌در‌دمنهای‌دمناظ ‌ ا‌کلمهآشکارسازی‌تمام‌نمونه :5-‌5شکل‌

‌‌در ‌‌7-‌5شکل ‌و ‌پایین0-‌5شکل ‌دارای ‌که ‌کلمات ،‌ ‌دقت ‌ت ین ‌دجمدموسط ‌کلمات‌در وعه

‌شره ‌انرپ سش ‌هسمنر‌نمایش‌داده ‌این‌کلمات‌دموسط‌کاهش‌دقتدلیل‌. ‌ ا ‌وجود‌کلمات‌دشا ه ،

ه‌عنوان‌اولین‌تصوی ‌در‌دمن‌پ سش ‌دورد‌نظ ‌ی‌کلمهنمونه،‌7-‌5شکل‌‌در.‌ اشردر‌دمن‌د پ سش ‌

‌است‌ول ‌ ه‌دلیل‌ ‌شره ‌کلمهوجود‌آشکار ‌ ا ‌کلمات‌دشا ه ‌در ‌تشخیص‌آنسا های‌رتبهی‌پ سش ‌و

‌در‌دورد‌7-‌5شکل‌‌ ه‌طور‌دثال‌در‌.است‌کاهش‌یافمه‌2545/1ی‌در‌آسمانهدموسط‌دقت‌‌، عری ،

‌"دا"،‌در‌دورد‌"صلاح"وجود‌‌"دنا ع"،‌در‌دورد‌"فحشا"ای‌داننر‌وجود‌کلمه‌"فساد"ی‌پ سش ‌کلمه

‌و‌‌"شمال"وجود‌‌"سال"،‌در‌دورد‌"این"وجود‌‌"لاتین"،‌در‌دورد‌"ها"وجود‌ اعث‌کاهش‌دقت‌.....

‌.‌کلمات‌شره‌است‌در‌این

دلیل‌دیگ ‌ ای‌کاهش‌دموسط‌دقت‌در‌ عض ‌از‌کلمات،‌ناخوانا‌نوشمه‌شرن‌آن‌کلمه‌در‌دمن‌

Rank5 Rank6 Rank7Rank4Rank1 Rank2 Rank3

5

5

7

3

3

4

6

Page 98: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

01

‌ اشرد .‌ ‌شره‌است‌0-‌5شکل‌ عض ‌از‌این‌دوارد‌در ‌نشان‌داده ‌ ودن‌کلمه. ی‌ ه‌طور‌دثال‌ناخوانا

‌" زدینه" ‌کادر‌دسمطیل ‌این‌کلمات‌ ا‌.ی ‌شره‌است‌تبهعرم‌تشخیص‌آن‌در‌ردوجب‌‌"فساد"یا

.انردشخص‌شره

‌.ت ین‌دقت‌دموسط‌هسمنرکلمات‌پ سش ‌که‌دارای‌پایین:‌7-‌5شکل‌‌‌

.ی ‌شره‌است‌رتبهناخوانا‌نوشمه‌شرن‌ عض ‌از‌کلمات‌دوجب‌عرم‌تشخیص‌آنسا‌در‌: 0-‌5شکل‌

خیط‌‌های‌آن‌که‌د وط‌ ه‌پنج‌دسیت‌ی‌پ سش ‌و‌نمونه،‌تصوی ‌کلمه01-‌5شکل‌‌و‌2-‌5شکل‌در‌

ها‌ ه‌عنوان‌اولین‌تصوی ‌این‌نمونهاین‌رو ‌دوفق‌ ه‌تشخیص‌.‌دمفاوت‌هسمنر‌نمایش‌داده‌شره‌است

.‌دهنیر‌را‌نشان‌د این‌تصاوی ‌تنوع‌درون‌کلاس ‌کلمات‌‌.ی‌پ سش ‌در‌دمن‌شره‌استدمناظ ‌ ا‌کلمه

‌.دهرالگوریمم‌پیشنسادی‌ ا‌در‌نظ ‌گ فمن‌این‌تنوع‌دورن‌کلاس ‌ از‌هم‌نمایج‌قا ل‌قبول ‌ارائه‌د

Query Rank1 Rank2 Rank5Rank4Rank3 P R

33.54

52.98

58.33

55.17

53.33

56.67

31.19

43.25

32.24 90

90

65

90

46

80

75

55

80

Query Rank1 Rank2 Rank3 Rank4 Rank5 Rank6

Page 99: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

00

.ی‌پ سش ‌که‌الگوریمم‌دوفق‌ ه‌تشخیص‌آنسا‌شره‌استهای‌دمناظ ‌ ا‌کلمهنمونه: 2-‌5شکل‌

.ی‌پ سش ‌که‌الگوریمم‌دوفق‌ ه‌تشخیص‌آنسا‌شره‌استهای‌دمناظ ‌ ا‌کلمهنمونه: 01-‌5شکل‌

‌ ‌شر ‌آن‌اشاره ‌ ه ‌قبلا‌نیز ‌که ‌دشخصههمان‌طور ‌از ‌دوجب‌د ‌PHOCای‌داننراسمفاده شود‌،

ی‌کلمات‌پ سش ‌در‌دجموعه.‌کلمات‌دیره‌نشره‌در‌فاز‌آدوز ‌را‌نیز‌تشخیص‌دهر موانر‌الگوریمم‌

ی‌آزدون‌ ا‌دقت‌دموسط‌آدوز ‌صورت‌نگ فمه‌ول ‌در‌د حله‌"فوتبال"و‌‌"لاتین" ای‌کلمات ‌داننر‌

‌.انجام‌شره‌استعملیات‌تشخیص‌ ای‌این‌کلمات‌%‌‌99/05و‌55/99‌‌%

ی‌کانریر،‌دخمصات‌دکان ‌آنسا‌در‌دمن‌از‌قبل‌ذخی ه‌شره‌ ای‌تمام‌تصاوی ‌دوجود‌در‌دجموعه

ی‌پ سش ‌توسط‌الگوریمم،‌دیموان‌آن‌را‌ی‌کلمه ا‌توجه‌ ه‌این‌دوضوع،‌ عر‌از‌تشخیص‌نمونه‌.است

Query

Query

Page 100: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

04

‌.نمایش‌داده‌شره‌است‌09-‌5شکل‌ تا‌00-‌5شکل‌این‌رو ‌در‌‌.در‌دمن‌دشخص‌ک د

ی‌اساس‌در‌دمنجسمجوی‌کلمه:00-‌5شکل‌

ی‌اقمصاد‌در‌دمنجسمجوی‌کلمه:04-‌5شکل‌

‌ی‌دری یت‌در‌دمنجسمجوی‌کلمه:09-‌5شکل‌

Page 101: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

09

زمان اجرای الگوریتم 1-2-9-4

-ای‌از‌دولفهی‌جراسازی‌خطوط‌و‌اسمخ اج‌دنبالهی‌آدوز ‌روی‌پایگاه‌داده‌فارسا،‌د حلهد حله

ی‌در‌د حله.‌شودد ‌خط‌انجام‌شره‌و‌نمایج‌آن‌ذخی ه صورت‌ ون‌FHTهای‌دمصل‌روی‌پایگاه‌داده‌

-ی‌پ سش ‌ صورت‌ خط‌عملیات‌جسمجو‌انجیام‌دی ‌‌ی‌دمن ‌کلمهآزدون‌ ا‌وارد‌شرن‌تصوی ‌و‌رشمه

‌: صورت‌زی ‌است‌"کالا"ی‌پ سش ‌زدان‌اج ای‌ه ‌ی ‌از‌د احل‌ ای‌کلمه.‌شود

ی‌دمن ‌در‌فضای‌ چسب‌ ا‌زدان‌تعبیه‌رشمهPHOC‌‌=1155/1ثانیه

زدان‌اسمخ اج‌ویژگ‌DSIFT‌‌‌ ثانیه1901/1=از‌تصوی

ثانیه14440/1=‌زدان‌اسمخ اج‌ دار‌فیش

ثانیه‌1029/1=‌زدان‌تعبیه‌ دار‌فیش ‌در‌فضای‌دشخصه

زدان‌تعبیه‌ چسب‌PHOCثانیه‌1140/1=در‌فضای‌ داری‌دشم ک‌

ثانیه‌1012/1=زدان‌تعبیه‌رتبه‌دشخصه‌در‌فضای‌ داری‌دشم ک

ی‌کانرییر‌در‌زیی ‌فضیای‌‌‌‌دیورد‌نظی ‌در‌ یین‌دجموعیه‌‌‌‌ی‌پ سش ‌ی‌کلمهزدان‌جسمجو

ثانیه‌7/5=عمود

‌‌ ‌‌4059از‌تعراد‌‌4-4-5ی‌آخ ‌شادل‌کاهش‌دجموعه‌تصاوی ‌کانریر‌ اساس‌رو ‌ خش‌د حله

تی ین‌آن‌‌تصوی ‌دقایسه‌شره‌و‌نزدی 0575 اینی‌پ سش ‌دورد‌نظ ‌ ا‌کلمهسپس‌‌. اشرد ‌0575 ه

‌.شودنظ ‌گ فمه‌شره‌و‌دکان‌آن‌روی‌سنر‌تصوی ی‌دشخص‌د ‌ی‌دری‌کلمه ه‌عنوان‌نمونه

( بندی تطبیقییبا ناحیه GMMآموزش )دوم روش پیشنهادی 1-9

ها‌کل‌تصوی ‌ صورت‌یکجا‌از‌ویژگ ‌GMM یان‌شر‌ ای‌آدوز ‌‌4-9-9طور‌که‌در‌ خش‌همان

ه ‌ناحیه‌ ه‌صورت‌دسمقل‌های‌ناحیه‌تقسیم‌شره‌و‌ویژگ ‌04شود‌ لکه‌ا مرا‌تصوی ‌ ه‌اسمفاده‌نم

های‌همان‌ناحیه‌آدوز ‌داده‌روی‌ه ‌ناحیه‌ ا‌توجه‌ ه‌ویژگ ‌GMMشونر‌و‌از‌هم‌در‌نظ ‌گ فمه‌د

Page 102: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

05

‌شودد ‌رو ‌قبل ‌. ‌ ه‌اینکه‌دخمصات‌دکان ‌در ‌توجه ‌‌هاویژگ ا و‌5/1 ین‌ ای‌ه ‌تصوی ‌کلمه،

دکان‌این‌نوارها‌ ای‌.‌ی ‌ایجاد‌شرنوار‌افق ‌روی‌تصو‌و‌دونوار‌عمودی‌‌ششن دال‌شره‌است،‌‌-5/1

- نری‌تطبیق ‌پیشنساد‌داده‌د ،‌ناحیهGMMدر‌این‌ خش‌ ای‌آدوز ‌‌.تماد ‌تصاوی ‌ثا ت‌است

جای ‌ادکان‌وجود‌جا ه.‌اسمفاده‌شره‌است‌]55 [ نری‌تطبیق ‌از‌رو ‌پیشنسادی‌در ای‌ناحیه.‌شود

‌ناحیهنوشمهو‌تغیی ‌دکان‌در‌کلمات‌دست ‌در ‌انرازه‌ نری، ‌ اعث‌د ‌ی ا های‌قلم‌پیکسلشود‌ثا ت،

‌ ‌دوجود ‌ناحیهدر ‌در ‌دمناظ ‌ی ‌جنس‌نباشنر‌تصاوی های ‌از ‌ناحیه. ‌از ‌دساله ‌این ‌حل نری‌ ای

‌(05-‌5شکل‌و‌05-‌5شکل‌).‌نوشمه‌فارس ‌دارد‌اسمفاده‌شره‌استتطبیق ‌که‌تناسب‌ یشم ی‌ ا‌دست

‌تصاوی ‌د وط‌ ه‌ی ‌کلاس‌(‌الف‌و‌ب:‌)05-‌5شکل‌

‌]55 [ی‌ثا ت نری‌ ا‌انرازهناحیه(‌پ‌و‌ت)و‌

‌]55 [های‌ی ‌کلاس نری‌تطبیق ‌ ای‌نمونهناحیه:‌05-‌5شکل‌

Page 103: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

05

- ای‌ناحیه.‌کنرتغیی ‌د نوارهای‌عمودی‌و‌افق ‌‌دکانه ‌کلمه‌تصوی ‌دمناسب‌ ا‌‌در‌این‌رو

های‌سیاه‌در‌این‌تعراد‌پیکسلکه‌‌شود‌ ه‌طوری نری‌تطبیق ،‌ا مرا‌تصوی ‌ ه‌دو‌نوار‌افق ‌تقسیم‌د

شود‌ ه‌طوری‌که‌تعراد‌ اشنر‌سپس‌تصوی ‌ ه‌شش‌نوار‌عمودی‌تقسیم‌د دو‌نوار‌افق ‌ ا‌هم‌ ا ‌

-ی‌ناحیهشود‌انرازهاین‌رو ‌ اعث‌د ‌.های‌عمودی‌ ا‌هم‌ ا ‌ اشنری‌نوارهای‌سیاه‌در‌همهپیکسل

‌ ه‌توزیع‌پیکسل ‌توجه ‌ ا ‌در‌ه ‌تصوی ‌کلمه این‌رو ‌این‌است‌که‌‌تدزی‌.های‌سیاه‌تغیی ‌کنرها

های‌کوچکم ‌در‌کنر‌و‌ناحیهی‌نوشمن‌کلمه‌دست‌نوشمه‌تغیی ‌د و‌نحوهها‌طبق‌دکان‌هناحیی‌انرازه

‌.‌نوشمه‌ایجاد‌شره‌استاط اف‌خط‌اصل ‌کلمه‌دست

بندی تطبیقیناحیه با GMMنتایج روش آموزش 1-9-4

‌F1 یشم ین‌دقرار‌.‌ی‌اول‌نشان‌داده‌شره‌است ای‌پنج‌آسمانه‌0-‌5جرول‌نمایج‌این‌رو ‌در‌

‌آسمانه ‌‌255/1ی‌در ‌ ا ‌ ا ‌است‌که ‌50/75 رست‌آدره ‌دیزان‌دقت‌د % ‌این‌آسمانه ‌در ‌که اشر

نری‌ثا ت‌در‌ نری‌تطبیق ‌و‌ناحیه ین‌ناحیهی‌دقایسه‌.است%‌50/77و‌دیزان‌ف اخوان ‌‌55/72%

جرول‌‌و‌2-‌5جرول‌در‌‌ی‌پ سش ای‌دو‌حالت‌ ازشناس ‌و‌جسمجوی‌کلمه‌رو ‌پ سش‌ ا‌تصوی

‌.‌ نری‌تطبیق ‌ سم ‌استدهر‌دقت‌رو ‌ناحیههمان‌طور‌که‌جرول‌نشان‌د .‌آورده‌شره‌است‌‌5-01

‌اول‌های‌آسمانهپنج‌در‌سنر‌دمن ‌‌011 ‌روی‌دموسط‌دعیارهای‌کارای ‌رو ‌‌:0-‌5جرول‌‌‌‌‌‌‌‌‌

Threshold‌Performance

Criterion ‌ 3125/9 355/9 2575/1‌20/1‌2245/1‌

12/77‌11/73 00‌05/00‌14/09‌ Precision

9/01‌14/77 50/75‌12/70‌74/57‌Recall ‌‌‌

92/75‌50/75‌4/75‌20/74‌55/70‌F1‌

Page 104: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

05

ی‌پ سش ‌در‌دمن ین‌دو‌رو ‌ ای‌حالت‌جسمجوی‌کلمهی‌دقایسه:2-‌5جرول‌

‌F1ف اخوان ‌دقت‌رو

نری‌یناحیه

‌تطبیق

11/73 50/77‌50/75‌

ی‌ نری‌ناحیه

‌ثا ت

37/71 77‌50/74‌

ی‌ ین‌دو‌رو ‌ ای‌حالت‌ ازشناس دقایسه: 01-‌5جرول‌

‌‌P MAPرو

‌15/20‌11/31ی‌ نری‌تطبیق ناحیه

‌50/27‌5/39ی‌ نری‌ثا تناحیه

دموسیط‌‌ثا یت‌دارای‌دقیت‌‌‌‌ی ا‌انیرازه‌‌ نریرو ‌در‌دورد‌کلمات‌پ سش ‌که‌در‌رو ‌ناحیهاین‌

افیزایش‌‌ای‌ ه‌دیزان‌قا ل‌توجه‌را‌ ای‌این‌کلماتدموسط‌انر‌عملک د‌ سم ی‌داشمه‌و‌دقت‌پایین‌ وده

یالا‌‌دموسیط‌‌ثا ت‌نییز‌دارای‌دقیت‌‌‌‌ی ا‌انرازه‌ نریداده‌است‌ول ‌در‌دورد‌کلمات ‌که‌در‌رو ‌ناحیه

نشیان‌داده‌‌‌00-5جیرول‌‌ز‌ایین‌کلمیات‌در‌‌‌ خی ‌ا‌.‌ای‌ایجاد‌نک ده‌استهسمنر‌تفاوت‌قا ل‌دلاحضه

‌.انرشره

‌ نری‌تطبیق ‌و‌ثا تدقایسه‌ عض ‌از‌کلمات‌در‌دو‌رو ‌ناحیه‌ :00-‌5جرول‌

‌‌‌‌‌‌ی‌کلمه

‌پ سش ‌فوتبال‌جمسوری‌ی ‌شر‌لاتین‌دنا ع‌فساد‌زدینه

‌‌‌دقت‌دموسط‌

‌(تطبیق )

99/50‌57/75‌50/50‌99/57‌49/54‌05/55‌21‌011‌

‌دقتدموسط‌

‌(ثا ت)

5/91‌99/50‌70/51‌71/50‌19/99‌74/57‌75‌99/05‌

Page 105: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

07

نری‌تطبیقی ‌‌ی‌پ سش ،‌سه‌تصوی ‌اول ‌که‌توسط‌الگوریمم‌ناحیه ای‌ه ‌کلمه‌05-‌5شکل‌در‌

دهنیر‌رو ‌‌همان‌طور‌که‌تصاوی ‌نشیان‌دی ‌‌.‌انر‌نمایش‌داده‌شره‌است نری‌ثا ت‌آشکار‌شرهو‌ناحیه

‌.تطبیق ‌عملک د‌ سم ی‌دارد

ی‌دو‌رو دقایسه:05-‌5شکل‌

5 ‌

Rank1 Rank1Rank2 Rank2

Rank3Rank3

Adaptive Constant

Page 106: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

00

Page 107: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

02

:پنجمفصل

برای جداسازی خطوط و استخراجالگوریتم پیشنهادی

های متصل ای از مولفهدنباله

Page 108: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

21

مقدمه 5-4

‌اصل جراسازی‌خطوط‌دمن‌یک ‌ ‌ از‌از ‌شناس ‌نوری‌ح وف‌است‌ت ین‌د احل‌در ‌این‌. عملک د

‌گذار‌است‌ نری‌کلمات‌و‌ ازشناس ‌دمون‌تاثی ‌د حله‌ ‌تمام‌د احل‌ عری‌داننر‌قطعه ه‌طور‌کل ‌.

‌:گی د‌ی‌دمفاوت‌صورت‌د ‌ ازشناس ‌دمون‌در‌دو‌حوزه

ون‌چاپ دم (0

‌نویس‌دمون‌دست (4

این خطوط جراسازی هسمنر، اسمانرارد‌صورت ه چاپ دمون در کلمات و ح وف که آنجای از

خطوط‌و‌شکل‌‌ ین ی‌فاصله کلمات، ین ی‌فاصله دعمولا چاپ دمون در .است ت ساده نیز دمون گونه

کج ‌خطوط‌دمن‌نیز‌در‌دمون‌چاپ ‌یا‌وجود‌نرارد‌یا‌ سیار‌.‌ح وف‌ ه‌صورت‌دنظم‌و‌یکسان‌است

های‌ارائه‌شره‌ ای‌‌ ‌این‌اساس‌رو .‌است دمفاوت کادلا وضعیت‌نوشمه دست دمون در ادا‌.کم‌است

‌دمفاوت‌است ‌نیز ‌دسمه ‌این‌دو ‌جمله‌دواردی‌که‌جراسازی‌دمون‌دست. ‌‌از کنر‌‌دشکل‌د نویس‌را

‌.‌اشاره‌ک دو‌خطوط‌توان‌ ه‌کج‌نوشمه‌شرن‌خطوط‌و‌هم‌پوشان ‌ ین‌ح وف‌‌د

‌این‌پایان‌ناده ‌اصل ‌،ی‌کلیری‌کلمه‌جسمجوی ای‌‌در جراسازی‌خطوط‌‌د احل‌ت ینیک ‌از

و‌اطلاعات‌کلمات‌دوجود‌در‌سنر‌تصوی ی‌ ایست‌کلمات‌و‌یا‌زی ‌ی‌ عری‌د ‌در‌د حله.‌ اشرد دمن‌

در‌رو ‌‌؛خط‌انجام‌شود یا‌خط‌ونتوانر‌ صورت‌ ‌د اسمخ اج‌کلمات‌.‌دکان ‌آنسا‌اسمخ اج‌شونر

‌تصاوی ‌دست‌خطون ‌رو ‌ فقط‌اطلاعات‌دکان ‌از ‌در ‌دسم س‌است‌ادا ‌ ‌نوشمه‌در خط‌علاوه

‌. اشنر‌یسمم‌د ی‌ح کت‌قلم‌دغناطیس ‌ورودی‌های‌س‌جست‌و‌نحوه‌،اطلاعات‌زدان ‌،اطلاعات‌دکان

های‌‌شونر‌ول ‌رو ‌نویس‌د ‌و‌هم‌نوشمار‌دست‌چاپ خط‌هم‌شادل‌ ازشناس ‌نوشمار‌های‌ ون‌رو

‌ ازشناس ‌دست ‌نویس‌کار د‌دارنر‌خط‌فقط‌در ‌اسمخ اج‌ ون. ‌ ای‌از‌‌خط‌دنبالهاین‌پایان‌ناده

‌.های‌دمصل‌دمم کز‌شره‌است‌دولفه

ی‌اسمخ اج‌‌ اشر‌که‌ ‌پایه‌ی‌نگار ‌د ‌دسمقل‌از‌نحوه‌د حله ای‌انجام‌این‌رو ‌پیشنسادی‌‌

Page 109: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

20

سپس‌.‌ی‌دمصل‌ ه‌خط‌د وط‌ ه‌خود ‌است‌ی ‌دمن‌و‌اخمصاص‌دادن‌ه ‌دولفه‌های‌دمصل‌دولفه

های‌دمصل ‌که‌د وط‌ ه‌ی ‌کلمه‌دسمقل‌در‌دمن‌هسمنر‌ ه‌همان‌ت تیب ‌که‌در‌کلمه‌ق ار‌‌دولفه

در‌واقع‌.‌تا‌در‌نسایت‌ موان‌کلمات‌دمن‌را‌از‌یکریگ ‌تفکی ‌ک د‌شونر‌دارنر‌ ا‌این‌رو ‌شناسای ‌د

نویس‌‌خط‌دمون‌دست‌ نری‌ ون‌های‌دمصل‌ی ‌کلمه‌و‌قطعه‌ای‌از‌دولفه‌این‌رو ‌ ه‌اسمخ اج‌دنباله

‌.انجام‌د احل‌ یان‌خواهر‌شر‌ینحوهدر‌اداده‌‌.پ دازد‌فارس ‌در‌سطح‌کلمه‌د

اصلی هر خط های متصل استخراج مولفه 5-2

کیه‌‌‌ اشینر‌ یه‌طیوری‌‌‌‌ صیورت‌ یاین ی‌دی ‌‌‌ ای‌این‌د حلیه‌‌ی‌دورد‌اسمفاده‌‌تصاوی ‌پایگاه‌داده

هیای‌‌‌تمیام‌دولفیه‌‌در‌ایین‌د حلیه‌ا میرا‌‌‌‌.‌هسمنر‌سفیرهای‌قلم‌‌و‌پیکسل‌سیاههای‌پس‌زدینه‌‌پیکسل

‌،تی ین‌‌‌سیمت‌راسیت‌‌‌،تی ین‌‌پیایین‌‌، یالات ین‌‌،دخمصات‌د کز.‌شونر‌دمصل‌د وط‌ ه‌دمن‌اسمخ اج‌د

عی ض‌و‌تعیراد‌‌‌‌،طیول‌ یه‌همی اه‌‌‌‌هیای‌د یوط‌ یه‌هی ‌دولفیه‌دمصیل‌‌‌‌‌‌‌و‌تمام‌پیکسل‌ت ین‌سمت‌چپ

نشیان‌‌0-‌5شیکل‌‌این‌نقاط‌در‌.‌شود‌ ه‌د ای‌ذخی‌‌ ه‌صورت‌جراگانه‌در‌ی ‌لیست‌اولیه‌ی‌آنها‌پیکسل

های‌دمصیل‌دوجیود‌در‌دیمن‌ یا‌در‌نظی ‌‌‌‌‌‌‌های‌تمام‌دولفه‌هیسموگ ام‌تعراد‌پیکسل‌سپس‌.انر‌‌داده‌شره

های‌دمصیل ‌کیه‌تعیراد‌‌‌‌‌د کز‌اولین‌ ازه‌در‌نظ ‌گ فمه‌شره‌و‌دولفه.‌شود‌ ازه‌دحاسبه‌د ‌011گ فمن‌

ورت‌که‌ یه‌صی‌‌ ‌ینویزها اعث‌حذف‌‌د حلهانجام‌این‌‌.شونر‌د ‌پیکسل‌آن‌از‌این‌حر‌کمم ‌است‌حذف

شره‌در‌این‌د حله‌قا ل‌توجه‌‌ی‌دمصل‌حذف‌تعراد‌دولفه.‌شود‌د ‌در‌تصاوی ‌وجود‌دارنرنقاط‌کوچ ‌

ایین‌‌‌4-‌5شیکل‌‌در‌.‌اسیت‌در‌د احیل‌ عیری‌‌‌و‌افیزایش‌دقیت‌‌‌کیه‌ اعیث‌کیاهش‌دحاسیبات‌‌‌‌‌‌ اشرد

‌‌.هیسموگ ام‌ ای‌یک ‌از‌تصاوی ‌نمایش‌داده‌شره‌است

Page 110: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

24

‌طول‌‌‌‌‌‌‌

‌‌‌

.شود‌ی‌دمصل‌ذخی ه‌د ‌دولفهنقاط ‌که‌ ای‌ه ‌ :0-‌5شکل‌

های‌دمصل‌دوجود‌در‌دمن‌های‌تمام‌دولفه‌هیسموگ ام‌تعراد‌پیکسل:4-‌5شکل‌

ی‌‌دولفیه‌‌؛شیود‌‌ ا‌در‌نظ ‌گ فمن‌اینکه‌در‌فارس ‌از‌ الا‌سیمت‌راسیت‌نوشیمن‌آغیاز‌دی ‌‌‌‌‌در‌اداده‌

هیای‌‌است‌و‌تعراد‌پیکسیل‌‌Yو‌کمم ین‌دقرار‌‌‌Xکه‌دخمصات‌د کز‌آن‌دارای‌ یشم ین‌دقرار‌دمصل

ی‌دمصیل‌اولییه‌انمخیاب‌‌‌‌‌ یه‌عنیوان‌دولفیه‌‌‌‌، اشیر‌‌ی‌در‌نظ ‌گ فمه‌شیره‌ یشیم ‌دی ‌‌‌‌آن‌از‌ی ‌آسمانه

‌دمصل ‌کوچک ‌داننر‌نقطه‌ ه‌عنوان‌‌یدر‌نظ ‌گ فمن‌این‌آسمانه‌ ه‌این‌علت‌است‌که‌دولفه.)گ دد‌د

‌(.در‌نظ ‌گ فمه‌شره‌است‌051این‌آسمانه‌ ای‌تمام‌تصاوی ‌‌.اولین‌انمخاب‌نشود

‌Yو‌X ‌را طیه‌در‌ایین‌‌.‌شیود‌‌اسیمفاده‌دی ‌‌‌(0-5)‌یرا طیه‌دمصیل‌از‌‌‌ی‌‌ ای‌انمخاب‌ایین‌دولفیه‌‌

ی‌‌دولفیه‌.‌دمن‌دحاسبه‌شره‌است‌های‌دمصل‌ ه‌ازای‌تمام‌دولفهFCC و‌دقرار‌دخمصات‌د کز‌هسمنر‌

0 200 400 600 800 1000 1200 1400 1600 18000

50

100

150

پیکسل‌‌(X,Y)‌دخمصات‌دکان

‌ الای‌سمت‌چپ‌‌گوشه

ت ین‌پایین‌‌ Yدخمصات

‌ی‌دمصلپیکسل‌دولفه

‌ارتفاع

سمت‌‌‌Xدخمصات‌

ت ین‌پیکسل‌راست

‌ی‌دمصل‌دولفه

‌دخمصات‌دکان ‌د کز

Page 111: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

29

.‌ی‌اولین‌خط‌ه ‌دمن‌است‌است‌ش وع‌کننره‌FCCدمصل ‌که‌دارای‌ یشم ین‌دقرار‌

(5-0)‌

دمصیل‌اولییه‌ یا‌در‌نظی ‌‌‌‌‌‌یدمصل‌در‌دمن‌ ه‌ایین‌دولفیه‌‌‌یت ین‌دولفه‌ی‌ عری‌نزدی ‌در‌د حله

‌:شود‌گ فمن‌دو‌ش ط‌زی ‌انمخاب‌د

دمصیل‌اولییه‌‌‌‌ید کز‌دولفیه‌‌xدمصل‌ ایر‌از‌دخمصات‌‌یت ین‌دولفه‌د کز‌نزدی ‌xدخمصات‌‌(0

‌(.تا‌ح کت‌همیشه‌از‌ش وع‌ی ‌خط‌ ه‌سمت‌انمسای‌آن‌ اشر.)کمم ‌ اشر

نظ ‌‌‌در‌05د اکز‌آنسا‌از‌ی ‌آسمانه‌که‌ ای‌همه‌دمون‌Y قرر‌دطلق‌اخملاف‌ ین‌دخمصات‌(4

‌ اشر ‌است‌کمم ‌شره ‌ اعث‌د .)گ فمه ‌د ‌این ‌دو ‌ه ‌اینکه ‌احممال ‌را‌شود ‌ی ‌خط‌ اشنر وط‌ ه

‌(‌افزایش‌دهر

XFCC(4-5)‌ی‌را طهدر‌.‌ی‌اقلیرس ‌است‌ی‌فاصله‌ی‌دمصل‌ ا‌دحاسبه‌ت ین‌دولفه‌انمخاب‌نزدی

‌Dو‌‌های‌دمصل‌دمن‌کز‌سای ‌دولفهادخمصات‌د ‌‌‌Yو‌‌‌X،اولیه‌ی‌دمصل‌دخمصات‌د کز‌دولفه‌YFCCو‌

ا‌در‌نظ ‌‌.استی‌دمصل‌ت ین‌دولفه ه‌نزدی کمم ین‌فاصله‌د وط‌‌. اشر‌د آنسا‌‌دیزان‌فاصله‌ ین

ی‌دمصل ‌است‌که‌در‌همین‌خط‌ عر‌دولفهدر‌واقع‌ی‌دمصل،‌ت ین‌دولفه،‌نزدی 4و‌‌0گ فمن‌ش ط‌

‌( ا‌در‌نظ ‌گ فمن‌ح کت‌از‌سمت‌راست‌ ه‌چپ‌خط) .ی‌دمصل‌اولیه‌ق ار‌گ فمه‌استاز‌دولفه

(5-4)‌

ای‌این‌راسما‌‌01ی‌ الا‌ض یب‌‌را طهدر‌‌دارنر،ق ار‌‌‌Y ا‌توجه‌ ه‌اینکه‌خطوط‌دمن‌در‌راسمای‌دحور‌

Page 112: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

25

‌ ‌شره ‌گ فمه ‌نظ ‌دولفه‌استدر ‌دخمصات‌‌تا ‌است‌‌Yهای‌دمصل ‌که ‌ی ‌دحروده ‌در ‌واقع‌‌،آنسا در

این‌ض یب‌احممال‌ ه‌عبارت‌دیگ ‌‌.انمخاب‌شونر‌ت ین‌ ه‌عنوان‌نزدی ‌،د وط‌ ه‌ی ‌خط‌هسمنر

‌.دهرت ین‌انمخاب‌شود‌را‌تا‌حری‌کاهش‌د ه‌عنوان‌نزدی ی‌دمصل ‌از‌خط‌ عری‌اینکه‌دولفه

ولیه‌ق ار‌داده‌شره‌ای‌دمصل‌دولفهنزدیکم ین‌دولفه‌دمصل‌ رست‌آدره‌در‌ الا‌ ه‌عنوان‌در‌اداده‌

ا‌‌در‌نسایت‌.شود‌ی‌دمصل‌نزدی ‌ ه‌آن‌دحاسبه‌د ‌دولفه‌،و‌دو‌ش ط‌ یان‌شره‌(4-5)ی‌‌را طه ا‌و‌

های‌دمصل‌خط‌اول‌ صورت‌ی ‌زنجی ه‌و‌ ه‌همان‌ت تیب ‌که‌در‌دمن‌‌‌تمام‌دولفهتک ار‌این‌الگوریمم‌

در‌که‌ی‌دمصل ‌کنر‌که‌دیگ ‌هیچ‌دولفهاین‌الگوریمم‌تا‌جای ‌اداده‌پیرا‌د .‌آینرد ق ار‌دارنر‌ رست‌

‌.دو‌ش ط‌ الا‌صر ‌کنر‌وجود‌نراشمه‌ اشر

.‌شود‌های‌دمصل‌اصل ‌اولین‌خط‌ذخی ه‌د ‌خ وج ‌این‌قسمت‌ ه‌عنوان‌لیسم ‌از‌د اکز‌دولفه

های‌دمصل‌ ا‌همان‌ت تیب ‌که‌در‌دمن‌از‌سمت‌راست‌ ه‌چپ‌‌ ه‌دلیل‌ق ار‌دادن‌ش ط‌اول‌این‌دولفه

‌انر‌آدره‌در‌این‌لیست‌هم‌ رست‌،انر‌پشت‌س ‌هم‌ق ار‌گ فمه سمت‌‌،ت ین‌پایین‌،دخمصات‌ الات ین.

ع ض‌و‌‌،طول ه‌هم اه‌های‌دمصل‌های‌د وط‌ ه‌این‌دولفه‌ت ین‌و‌تمام‌پیکسل‌سمت‌چپ‌،ت ین‌‌راست

د احل‌را‌نشان‌این‌‌5-‌5شکل‌‌تا‌9-‌5شکل‌.‌شونر‌ ه‌صورت‌جراگانه‌ذخی ه‌د ‌های‌آن‌تعراد‌پیکسل

‌.‌دهنر‌د

را‌در‌نظ ‌‌5-‌5شکل‌.‌ی‌دمصل‌ ا‌رنگ‌سبز‌دشخص‌شره‌است‌ی‌ه ‌دولفه‌دحروده‌9-‌5شکل‌در‌

انر‌ ه‌دلیل‌‌ههای‌دمصل ‌که‌د وط‌ ه‌خط‌اول‌ ود‌ گی یر‌همان‌طور‌که‌دشخص‌است‌ عض ‌از‌دولفه

های‌دمصل‌ ا‌‌این‌دولفه‌.انر‌های‌دمصل‌اصل ‌ق ار‌نگ فمه‌انر‌جز‌دولفه‌ر ‌نک دهاینکه‌در‌ش ط‌اول‌ص

‌انر‌رنگ‌ق دز‌دشخص‌شره ‌خ ‌ ه‌جایگذاری‌آنسا‌در‌دکان‌د وط‌ ه‌خودشان‌پ داخمهآ‌ی‌د حله‌در.

ه‌ت تیب‌در‌لیست‌اصل ‌‌"س "و‌‌"س "‌،"هو"های‌دمصل‌‌دولفه‌5-‌5شکل‌ ه‌طور‌دثال‌در‌‌.شود‌د

‌ق ار‌دارنر ی‌‌ی‌خود‌یعن ‌دولفه‌ت ین‌ ه‌ رنه‌نزدی ‌(4-5)‌یرا طهی‌دمصل‌نقطه‌ ا‌توجه‌ ه‌‌دولفه.

است‌در‌" س "د کز‌‌‌Xدخمصات‌‌د کز‌آن‌ یشم ‌از‌‌Xاست‌ادا‌ ه‌دلیل‌اینکه‌دخمصات‌" س "دمصل‌

Page 113: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

25

‌.لیست‌اصل ‌ق ار‌نگ فمه‌است

‌پس‌ ‌انجام ‌‌پ داز ‌ ا ‌ ‌اصل های ‌لیست ‌این ‌دولفه‌،روی ‌نسای ‌اول‌‌لیست ‌خط ‌دمصل های

‌های‌دمصل‌دوجود‌در‌دمن‌دولفه‌های‌دمصل‌نسای ‌خط‌اول‌از‌لیست‌کل‌ ا‌حذف‌دولفه‌.آیر‌د ‌ رست‌

‌ا مرا ‌الگوریمم‌از ‌تک ار ‌ا‌،و ‌و ‌شره ‌اولین‌دولفه‌دمصل‌د وط‌ ه‌خط‌دوم‌پیرا ین‌خط‌دورد‌این‌ ار

در‌واقع‌این‌الگوریمم‌ ه‌تعراد‌.‌شونر‌آن‌ذخی ه‌د ‌های‌دمصل‌د وط‌ ه‌‌فهگی د‌و‌دول‌پ داز ‌ق ار‌د

‌.‌های‌قبل‌از‌خود ‌دورد‌پ داز ‌ق ار‌گی د‌شود‌تا‌ه ‌ ار‌ی ‌خط‌ ا‌حذف‌خط‌خطوط‌دمن‌انجام‌د

‌‌

‌‌های‌دمصل‌داخل‌دمن‌اسمخ اج‌تمام‌دولفه:9-‌5شکل‌

‌‌‌‌

‌‌‌‌‌‌‌(رنگ‌آ )های‌دمصل‌اصل ‌خط‌اول‌خی ه‌دولفهذ:5-‌5شکل‌

Page 114: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

25

آنسا‌شناسای های‌دمصل‌خط‌اول‌ ه‌ت تیب‌نمایش‌دولفه:5-‌5شکل‌

های‌دمصل‌خط‌اول‌ ه‌دلیل‌صر ‌نک دن‌در‌ش ط‌ی ‌در‌لیست‌دولفه‌هوش ی‌‌‌ق ار‌نگ فمن‌نقطه‌:5-‌5شکل‌

طهای متصل اصلی هر خ روی مولفه شزپردا پس 5-9

‌پ دازش ‌انجام‌شره‌تا‌اگ ‌دولفه‌دمصل ‌اشمباها‌در‌د حله‌قبل‌ ه‌ی‌جایگذاری‌پس‌قبل‌از‌د حله

‌از ‌گ دد‌خطوط‌یک ‌حذف ‌لیست ‌از ‌شره ‌کاهش‌‌این‌پس .اخمصاص‌داده ‌را ‌خطا پ داز ‌درصر

‌دهر‌د ‌واقع‌این‌پس. ‌ رست‌آدرن‌لیست‌دولفهدر های‌دمصل‌اصل ‌ه ‌خط‌انجام‌‌پ داز ‌ عر‌از

‌.شود‌خط‌حذف‌د ‌،شود‌و‌ عر‌از‌انجام‌آن‌د

‌ ‌است ‌صورت ‌این ‌ ه ‌رو ‌این ‌عملک د ‌که ‌دخمصات ‌ا مرا ‌همه‌پیکسل (X,Y)دکان ی‌‌های

‌اصل های‌دمصل‌درون‌لیست‌‌دولفه ‌نظ ‌گ فمه‌،د وط‌ ه‌ه ‌خط، و‌‌شره‌ صورت‌ی ‌دجموعه‌در

‌از‌این‌ رنه‌دحرب‌دحاسبه‌شره‌که‌تق یبا‌‌.شود‌نسا‌رسم‌د آشادل‌ رنه‌دحرب سپس‌خط‌گذرنره

دخمصات‌‌،خط‌ی‌دمصل‌اصل ‌ی‌ عری‌ ای‌ه ‌دولفه‌در‌د حله‌.دهر‌را‌نشان‌د ‌ی‌خط‌پایه‌دحروده

ی‌‌در‌نظ ‌گ فمه‌شره‌و‌فاصله(‌ی‌دمصل‌ی‌پایین‌سمت‌چپ‌ه ‌دولفه‌گوشه)پیکسل‌ت ین‌دکان ‌پایین

First Connected

Component in the line

Last Connected

Component in the line

Page 115: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

27

ی ‌حر‌آسمانه‌ یشم ‌ ود‌این‌‌این‌فاصله‌ازاگ ‌‌.شود‌دحاسبه‌د ‌‌‌Yآن‌از‌خط‌پایه‌در‌جست‌راسمای

‌21این‌آسمانه‌ ای‌تمام‌تصاوی ‌)‌.شود‌دمصل‌د وط‌ ه‌این‌خط‌نبوده‌و‌از‌لیست‌حذف‌د ‌ی‌دولفه

‌است ‌شره ‌گ فمه ‌نظ ‌این‌صورت‌.(در ‌خطهای‌دمصل‌‌لیست‌نسای ‌دولفه‌ ه ‌ه رست‌‌د وط‌ ه

دو اره‌دعادله‌خط‌نسای ‌ ه‌دست‌آدره‌و‌‌، ا‌ رست‌آوردن‌این‌لیست‌نسای ‌ ا‌همان‌رو ‌قبل .‌آیر‌د

‌.نمایش‌داده‌شره‌است‌2-‌5شکل‌تا‌‌7-‌5شکل‌د احل‌این‌قسمت‌در‌‌.شود‌ذخی ه‌د

‌آنسا‌و‌خط‌گذرنره‌از‌آن رنه‌دحرب‌شادل‌یافمن‌و‌‌اصل ‌خط‌اول‌دمصل‌های‌ذخی ه‌دولفه: 7-‌5شکل‌

‌.انر‌دو‌دولفه‌دمصل ‌که‌د وط‌ ه‌خط‌چسارم‌هسمنر‌و‌ ه‌اشمباه‌ ه‌خط‌سوم‌اخمصاص‌یافمه‌:0-‌5شکل‌

‌‌

های‌دمصل‌ ا‌دعادله‌خط‌سوم‌ی‌دولفه‌تصحیح‌خطای‌ الا‌ ا‌در‌نظ ‌گ فمن‌فاصله: 2-‌5شکل‌‌‌‌‌‌‌‌

‌از‌ی ‌تا ع‌درجه‌دوم‌ صورت ای‌دحاسبه‌کل ه‌طور‌ ‌ا مرا bX+ c ) ‌(aX+ی‌خط،اسمفاده‌‌2

در‌ عض ‌از‌دوارد‌اگ ‌شیب‌.‌در‌دورد‌خطوط‌کج‌دمن‌،‌این‌خط‌ ه‌صورت‌ی ‌سسم ‌است.‌شره‌است

‌د حله ‌ اشر‌در ‌ایجاد‌د ی‌پساین‌سسم ‌از‌حری‌ یشم ‌کنرپ داز ‌خطا ‌دورد‌. ‌دو ‌در این‌خطا

‌.‌آیر وجود‌د

-جزء‌دولفهدر‌آخ ‌خط‌پنجم‌‌‌"ست"و‌‌"ه"ی‌دمصل‌نقطه،‌هادولفه01-‌5شکل‌ ه‌طور‌دثال‌در‌

x

y

fitted curve

x

y

fitted curve

x

y

fitted curve

Page 116: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

20

‌ششم‌های‌دمصل‌خطو‌در‌پ داز ‌خط‌ عری‌جزء‌دولفه‌انرهای‌دمصل‌اصل ‌این‌خط‌ق ار‌نگ فمه

ه‌صورت‌ی ‌دنحن ‌است‌ از‌هم‌‌ششم‌خط ه‌دلیل‌اینکه‌پ داز ‌ی‌پسدر‌د حله.‌رنگی د ق ار‌

ی‌در‌نظ ‌گ فمه‌شره‌کمم ‌است‌و‌قادر‌ ه‌خط‌از‌دقرار‌آسمانهاین‌ ا‌های‌دمصل‌این‌دولفهی‌فاصله

تخمین‌‌aX+bول ‌اگ ‌همین‌خط‌ ه‌صورت‌تا ع‌درجه‌اول‌‌(00-‌5شکل‌)‌.تصحیح‌این‌اشمباه‌نیست

‌(.05-‌5شکل‌‌تا‌04-‌5شکل‌).شودزده‌شود‌این‌خطا‌تصحیح‌د

ی‌دمصل‌جزء‌دولفه ا‌رنگ‌سبز‌دشخص‌است‌‌01-‌5شکل‌ی‌دمصل ‌که‌در‌در‌حالت‌ عری‌دولفه

خط‌ی‌دمصل‌ ه‌دنحن ‌ی‌جایگذاری‌ ه‌دلیل‌اینکه‌این‌دولفهدر‌د حله.‌جا‌افماده‌از‌خط‌پنجم‌است

ا‌‌ول ‌(00-‌5شکل‌).کنر اشر‌اشمباها‌ ه‌این‌خط‌اخمصاص‌پیرا‌د ششم‌نزدیکم ‌از‌خط‌پنجم‌د

‌(09-‌5شکل‌).شودتخمین‌خط‌ششم‌ ه‌صورت‌تا ع‌درجه‌اول‌این‌خطا‌تصحیح‌د

X ا‌توجه‌ ه‌توضیحات‌ الا‌ ه‌طور‌کل ‌اگ ‌ض یب یشم ‌ ود‌خط‌ ا‌‌5/1×01(-5)از‌(‌ a یعن )‌ 2

اعمال‌این‌ش ط‌.‌شود‌و‌در‌غی ‌این‌صورت‌ صورت‌تا ع‌درجه‌دوم‌استتا ع‌درجه‌اول‌تخمین‌زده‌د

‌.شود اعث‌کاهش‌خطا‌و‌ سبود‌نمایج‌د

‌(خط‌ق دز)در‌نظ ‌گ فمن‌خط‌ششم‌ صورت‌تا ع‌درجه‌دو‌ :01-‌5شکل‌ x

y

fitted curve

Page 117: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

22

ایجاد‌خطا‌در‌جراسازی‌خط‌ششم:00-‌5شکل‌

‌‌‌‌‌‌‌‌

‌(خط‌ق دز)در‌نظ ‌گ فمن‌خط‌ششم‌ صورت‌تا ع‌درجه‌اول:04-‌5شکل‌

‌‌‌‌‌‌‌‌‌‌

‌پنجمتصحیح‌خطا‌در‌د حله‌جراسازی‌خط‌:09-‌5شکل‌

x

y

fitted curve

Page 118: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

011

تصحیح‌خطا‌در‌د حله‌جراسازی‌خط‌ششم:05-‌5شکل‌

های‌دمصل‌لیست‌نسای ‌ ی ای‌هی ‌خیط‌ یه‌صیورت‌‌‌‌‌‌‌ عر‌از‌اتمام‌این‌د حله‌ا مرا‌دشخصات‌دولفه

هیای‌دمصیل‌دیمن‌ یود‌حیذف‌‌‌‌‌‌‌ت‌اولییه‌کیه‌شیادل‌کیل‌دولفیه‌‌‌‌‌جراگانه‌ذخی ه‌و‌سپس‌از‌داخل‌لیسی‌

‌.گ دننر‌د

‌همان ‌که‌در ‌شر‌دولفه‌5-‌5شکل‌طور ‌ ه‌دلیل‌صر ‌‌ ه‌آن‌اشاره های‌دمصل ‌وجود‌دارنر‌که

های‌دمصل‌نزدی ‌ ه‌‌های‌نسای ‌خط‌اول‌‌ق ار‌نگ فمنر‌حال‌اگ ‌این‌دولفه‌جز‌دولفه‌0نک دن‌در‌ش ط‌

ا مرای‌خط‌ اشنر‌در‌د حله‌تک ار‌الگوریمم‌دو اره‌ ه‌عنوان‌ی ‌خط‌جرا‌در‌نظ ‌گ فمه‌شره‌و‌دورد‌

ل‌های‌دمصل‌ه ‌خط‌و‌قب‌اجمناب‌از‌این‌حالت‌ عر‌از‌ رست‌آوردن‌دولفه ای‌ .گی نر‌پ داز ‌ق ار‌د

‌:ی‌زی ‌انجام‌د ‌شود‌د حله‌یاز‌پ داز ‌خط‌ عر

‌ یشم ینرا‌در‌نظ ‌گ فمه‌و‌‌خط‌دمصل‌نسای ‌های‌‌دولفه‌ی‌همهت ین‌پیکسل‌‌پایین‌yدخمصات‌

‌ رست‌د ‌آیر‌آنسا ‌این‌‌دمنهای‌دمصل‌داخل‌‌دولفه ق ‌داسپس‌. ‌این‌دخمصات‌ ا ‌نظ ‌ یشم یناز

حذف‌‌دمن‌های‌دمصل‌کل‌دولفههسمنر‌از‌لیست‌ یشم ین‌شونر‌و‌آنسای ‌که‌کمم ‌از‌این‌‌دقایسه‌د

‌شونر‌شره‌و‌در‌لیست‌جریری‌ذخی ه‌د های‌دمصل ‌در‌واقع‌این‌لیست‌جریر‌ یشم ‌شادل‌دولفه.

های‌‌این‌دولفه‌05-‌5شکل‌.‌شونر‌ عرا‌جایگذاری‌د انر‌و‌‌ه‌دانر جا‌خط‌د وط‌ ه‌خودشاناست‌که‌از‌

Page 119: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

010

‌ ‌نشان‌د دمصل‌که ‌را ‌‌.دهر‌د وط‌ ه‌خط‌اول‌هسمنر ‌پایان‌این‌الگوریمم ‌خط‌در لیست‌ ای‌ه

‌دولفه ‌خط‌د وط‌ ه ‌نسای ‌ه ‌لیست‌دولفه‌،های‌دمصل ‌خط‌و ‌ه ‌از‌‌دعادله ‌افماده های‌دمصل‌جا

‌‌.آیر‌ رست‌د ‌خطوط

ود‌در‌های‌دمصل‌دوجدولفهی‌دمصل ‌در‌لیست‌کل‌‌اگ ‌دولفه‌، عر‌از‌پ داز ‌تمام‌خطوط‌دمن

‌نک دهدمن‌ ‌د حله‌ ود،‌ اق ‌دانره‌و‌ ه‌خط ‌اخمصاص‌پیرا ی‌ عری‌در‌جای‌دناسب‌جایگذاری‌‌در

‌ ای‌‌44-‌5شکل‌‌تا‌05-‌5شکل‌‌.شود‌د خط‌اول‌ ه‌ت تیب‌اج ای‌آن‌نشان‌‌چساراین‌الگوریمم‌را

‌دهرد .‌ ‌آن‌دعادلات‌خطوط‌رسم‌شره‌49-‌5شکل‌در ‌اصل ‌که‌در ‌تصوی ‌ ا ‌انر‌تصوی ی‌هم‌سایز

‌‌.نمایش‌داده‌شره‌است

پ داز عر‌از‌پس‌خط‌اولنسای ‌های‌دمصل‌‌دولفه:05-‌5شکل‌x

y

fitted curve

Page 120: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

014

(پ داز ی‌پس‌د حله)ی‌آنسا‌های‌دمصل‌از‌کل‌دمن‌و‌ذخی ه‌جراگانه‌ عض ‌از‌دولفهحذف‌:05-‌5شکل‌

پ داز عر‌از‌پس‌خط‌دومنسای ‌های‌دمصل‌‌دولفه: 07-‌5شکل‌

(پ داز ی‌پس‌د حله)ی‌آنسا‌دمصل‌از‌کل‌دمن‌و‌ذخی ه‌جراگانه‌های‌دولفه عض ‌از‌حذف‌:00-‌5شکل‌

x

y

fitted curve

Page 121: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

019

عر‌از‌پس‌پ داز ‌سومخط‌نسای ‌های‌دمصل‌‌دولفه:02-‌5شکل‌

(پ داز ی‌پس‌د حله)ی‌آنسا‌ذخی ه‌جراگانههای‌دمصل‌از‌کل‌دمن‌و‌‌دولفه عض ‌از‌حذف‌:41-‌5شکل‌

پ داز عر‌از‌پس‌چسارم‌خطنسای ‌‌های‌دمصل‌‌دولفه:40-‌5شکل‌

x

y

fitted curve

x

y

fitted curve

Page 122: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

015

(پ داز ی‌پس‌د حله)آنسا‌ی‌های‌دمصل‌از‌کل‌دمن‌و‌ذخی ه‌جراگانه‌دولفه عض ‌از‌حذف‌:44-‌5شکل‌

نمایش‌دعادلات‌خطوط :49-‌5شکل‌

جایگذاری 5-1

‌د حله ‌دولفه‌ی‌در ‌تمام ‌دورد ‌در ‌خط ‌اخمصاص‌نیافمه‌جایگذاری ‌هیج ‌ ه انر‌‌های‌دمصل ‌که

ی‌این‌‌ا مرا‌همه‌.انر‌ها‌و‌نقاط‌تشکیل‌داده‌های‌دمصل‌را‌س کش‌ یشم ‌این‌دولفه.‌شود‌گی ی‌د ‌تصمیم

‌د ‌دولفه ‌ذخی ه ‌لیست ‌ی ‌در ‌دمصل ‌ه ‌‌پایین y و x دخمصات‌سپس‌.شونر‌های ‌پیکسل ت ین

از‌سمت‌راست‌ ه‌چپ‌تصوی ‌‌‌xنظ ‌گ فمه‌شره‌و‌همه‌آنسا‌ ا‌توجه‌ ه‌دخمصات‌‌‌ل‌درهای‌دمص‌دولفه

دخمصات‌‌، ای‌ه ‌دولفه‌دمصل.‌شونر‌د تب‌شره‌و‌ ه‌همین‌ت تیب‌جایگذاری‌د (‌ ه‌صورت‌نزول )

x‌‌ فه‌دمصل‌و‌ ا‌در‌نظ ‌ ا‌د کزیت‌این‌دول‌49-‌5شکل‌‌را‌در‌نظ ‌گ فمه‌و‌ی ‌نوار‌سمون ‌روی‌تصوی

گ فمن‌سه‌پیکسل‌در‌سمت‌راست‌و‌سه‌پیکسل‌در‌سمت‌چپ‌آن‌تشکیل‌داده‌و‌سپس‌تصوی ‌در‌

Page 123: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

015

دشخص‌است‌ ه‌تعراد‌خطوط‌دمن‌قله‌‌45-‌5شکل‌طور‌که‌در‌‌همان.‌گ دد‌راسمای‌افق ‌جاروب‌د

‌‌. اشنر‌د وط‌ ه‌خط‌اول‌تا‌هفمم‌د ‌راست ه‌‌چپها‌ ه‌ت تیب‌از‌سمت‌‌قله‌این‌.تشکیل‌شره‌است

‌این‌قله ‌از ‌کرام ‌دخمصات‌دخمصات‌ه ‌ ا ‌که‌‌ی‌دولفه‌yها ‌کرام ‌ه ‌ ه ‌و ‌شره دمصل‌دقایسه

‌این‌دولفه ‌ ود ‌این‌است‌که‌چون‌ .دمصل‌د وط‌ ه‌همان‌خط‌است‌ی‌نزدیکم دزیت‌این‌رو ‌در

‌د ‌ی‌ صورت‌دحل ‌ ای‌ه ‌دولفه این‌د حله‌ ای‌‌. الات ی‌داردشود‌س عت‌دحاسبات‌‌دمصل‌اج ا

د وط‌ ه‌ی‌دمصل‌جا‌افماده‌‌دولفهه ‌دشخص‌شود‌های‌دمصل‌داخل‌لیست‌اج ا‌شره‌تا‌‌تمام‌دولفه

‌‌.استخط‌‌کرام

نمودار‌افق ‌افکنش‌دعادلات‌خطوط:45-‌5شکل‌

‌دولفه ‌دشخص‌شرن‌خط‌د وط‌ ه‌ه ‌ عر‌از ‌نظ ‌گ فمن‌فاصله‌ ای‌دمصل، ‌دولفه‌در ی‌‌ی‌ه

رونره‌یا‌روی‌‌پایین‌،رونره‌ الااین‌دولفه‌دمصل‌در‌گ وه‌‌،(yی‌در‌راسما)‌دمصل‌ ا‌خط‌د وط‌ ه‌خود

‌:گی د‌خط‌ق ار‌د

ها‌و‌نقاط‌‌س کش.‌ی‌دمصل‌جزء‌گ وه‌ الارونره‌است‌این‌دولفه ود‌‌00اگ ‌این‌فاصله‌ یشم ‌از‌ (0

.این‌گ وه‌ق ار‌دارنر‌ الای ‌کلمات‌در

نقاط‌پایین ‌.‌ی‌دمصل‌جزء‌گ وه‌پایین‌رونره‌است‌ ود‌این‌دولفه‌-05اگ ‌این‌فاصله‌کمم ‌از‌ (4

.در‌این‌گ وه‌ق ار‌دارنر‌کلمات

0 200 400 600 800 1000 12000

1

2

3

4

5

6

7

Page 124: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

015

‌ح وف‌روی‌خط‌است (9 ‌جزء ‌ الا ‌ش ط ‌دو ‌غی ‌در ‌دولفه. ‌نقاط‌و‌‌دعمولا ‌از ‌غی های‌دمصل

.س کش‌در‌این‌گ وه‌ق ار‌دارنر

دکان‌دناسب‌ ای‌‌،های‌دمصل‌دخمص‌ ه‌این‌خط‌ ای‌دولفهش وع‌ک ده‌و‌سپس‌از‌خط‌اول‌

‌.شود‌این‌رو ‌ ه‌ت تیب‌ ای‌تمام‌خطوط‌اج ا‌د .‌شود‌زی ‌دشخص‌د ‌رو جایگذاری‌ ا‌

انر‌ ا‌‌ی‌قبل‌ رست‌آدره‌های‌دمصل‌نسای ‌ه ‌خط‌که‌از‌د حله‌ یان‌شر‌دولفهقبلا‌همان‌طور‌که‌‌

از‌نظ ‌‌ ه‌عبارت‌دیگ ‌.انر‌از‌راست‌ ه‌چپ‌شناسای ‌شرهدر‌دمن‌‌،ز ان‌فارس ‌ویژگ در‌نظ ‌گ فمن‌

‌ی‌دحروده ه‌همین‌دلیل‌در‌این‌د حله‌ ای‌دشخص‌ک دن‌‌.انر‌شره ه‌صورت‌نزول ‌د تب‌‌xی‌‌دولفه

‌ی‌دمصل‌دناسب‌ ای‌جایگذاری‌دولفه ‌دخمصات‌، ‌دخمصات‌‌xا مرا ‌ ا ‌آن ‌دولفه‌xد کز های‌‌د اکز

های‌دمصل‌اصل ‌خط‌که‌نزدیکم ‌ ود‌‌دقایسه‌شره‌و‌ ه‌ه ‌کرام‌از‌دولفهد وطه‌خط‌دمصل‌نسای ‌

‌:ی‌ ه‌دست‌آدره‌ ه‌سه‌صورت‌زی ‌است‌این‌دحروده.‌ی‌دناسب‌ ای‌جایگذاری‌است‌دحروده

0) ‌ ‌دولفه‌xدخمصات ‌‌د کز ‌دخمصات ‌از ‌دمصل ‌دولفه‌xی ‌د اکز ‌‌تمام ‌دمصل ‌اصل ‌های خط

.شود‌ا مرای‌ه ‌خط‌جایگذاری‌د ‌ زرگم ‌است‌که‌در‌این‌صورت‌در

4) ‌ ‌دولفه‌xدخمصات ‌‌د کز ‌دخمصات ‌از ‌دمصل ‌دولفه‌xی ‌د اکز ‌‌تمام ‌دمصل ‌اصل ‌های خط

.شود‌کوچکم ‌است‌که‌در‌این‌صورت‌در‌انمسای‌ه ‌خط‌جایگذاری‌د

رونره‌یا‌روی‌خط‌‌پایین‌،رونره‌در‌گ وه‌ الای‌دمصل‌‌دولفه ا‌توجه‌ ه‌اینکه‌در‌غی ‌دو‌دورد‌ الا‌ (9

‌.شود‌های‌دمصل‌خط‌اصل ‌جایگذاری‌د ‌در‌ ین‌دولفه‌،است

.ی‌کل ‌در‌نظ ‌گ فمه‌شره‌است‌ ای‌قسمت‌سوم‌ ا‌توجه‌ ه‌ساخمار‌ز ان‌فارس ‌سه‌قاعره

رونده بالا ی متصل های جایگذاری مولفه روش 5-1-4

ی‌دمصیل‌خیط‌اصیل ‌کیه‌‌‌‌‌‌پینج‌دولفیه‌‌‌،ی‌ رست‌آدیره‌در‌ یالا‌‌‌در‌این‌حالت‌ ا‌توجه‌ ه‌دحروده

های‌دمصل ‌کیه‌در‌‌‌اکث ‌دولفه.‌شودد ی‌دمصل‌دارد‌در‌نظ ‌گ فمه‌‌ت ین‌د کز‌را‌ ه‌د کز‌دولفه‌نزدی

Page 125: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

017

ی ای‌آنسیا‌از‌ایین‌قاعیره‌اسیمفاده‌شیره‌کیه‌سیمت‌‌‌‌‌‌‌‌‌.‌رونره‌ق ار‌دارنر‌نقطه‌یا‌س کش‌هسمنر‌گ وه‌ الا

.‌دمصل‌خط‌اصل ‌نزدیی ‌اسیت‌‌‌ی‌‌دولفهپنج‌‌،سلت ین‌پیک‌راست‌ت ین‌پیکسل‌آنسا‌ ه‌کرام‌سمت‌‌چپ

ایین‌رو ‌‌.‌گیی د‌‌رونیره‌قبیل‌از‌آن‌قی ار‌دی ‌‌‌‌‌دولفه‌دمصل‌ الا‌،دمصل‌اصل ‌خط‌ی‌ ا‌یافمن‌این‌دولفه

ی‌دمصیل‌‌ها‌پینج‌دولفیه‌‌در‌این‌شکل.‌داده‌شره‌است‌نمایش 47-‌‌5شکل‌و‌45-‌5شکل‌ جایگذاری‌در

کیه‌‌ ی‌دمصیل‌خیط‌اصیل ‌‌‌رونیره‌و‌دولفیه‌‌ی‌دمصل‌ الادولفه.‌انرخط‌اصل ‌ ا‌رنگ‌ق دز‌دشخص‌شره

‌است‌ ا‌فلش‌دشیخص‌‌مهمه‌نزدیکرونره‌از‌ی‌ الاپیکسل‌سمت‌راست‌آن‌ ه‌پیکسل‌سمت‌چپ‌دولفه

.گی دی‌دمصل‌ق ار‌د رونره‌قبل‌از‌این‌دولفهی‌ الادولفه.‌انرشره

"گذا‌"ی‌اصل قبل‌از‌ رنه‌"گ"جایگذاری‌س کش:45-‌5شکل‌

"گ ‌"ی‌اصل قبل‌از‌ رنه‌"گ"جایگذاری‌س کش:45-‌5شکل‌

CC1CC2

CC3CC4

CC5

CC1CC2

CC3

CC4CC4CC5

Page 126: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

010

"سا"ی‌اصل جایگذاری‌نقطه‌قبل‌از‌ رنه:47-‌5شکل‌

رونده ی متصل پایین های جایگذاری مولفه روش 5-1-2

‌پایین ‌گ وه ‌دولفه‌دمصل ‌که‌در ‌نقاط‌د ‌اکث ‌هسمنر ‌ اشنر‌رونره ‌این‌اصل‌که‌ه ‌. ‌ ه ‌توجه ا

دخمصات‌)ی‌اصل ‌نقطه‌دورد‌نظ ‌است‌ یشم ین‌اشم اک‌از‌نظ ‌طول ‌‌نقطه‌ ا‌دولفه‌دمصل ‌که‌ رنه

x‌ ‌د ( ‌آن‌جای‌داده ‌قبل‌از ‌دارد ‌این‌حالت‌‌.شود‌را ‌دولفهدر ‌ یشم ‌دو ین‌ی‌دمصل‌اصل ‌خط‌که

‌دولفه ‌که ‌دارد ‌را ‌پایین‌احممال ‌د وط‌ ه‌ی‌دمصل ‌توسط‌را طه‌‌رونره ‌ اشر ‌‌آنسا ‌9-5)ی دشخص‌(

:شونر‌د

(5-9)‌

‌ ‌C(X)B-1،(9-5)ی‌‌در‌را طه ‌‌ ی‌دمصل‌خط‌اصل ‌هسمنر‌و‌‌د کز‌دولفه‌xدخمصات‌‌ C(X)Bو

C(X)I دخمصات‌‌xراست‌ ه‌سمت‌ ا‌توجه‌ ه‌اینکه‌ح کت‌از‌‌.رونره‌است‌ی‌دمصل‌پایین‌د کز‌دولفه‌

و‌ عر‌از‌آن‌‌‌ Bی‌دمصل‌ ا‌انریس‌‌دولفه‌های‌دمصل‌خط‌اصل ‌ا مرا‌‌چپ‌خط‌است‌در‌لیست‌دولفه

B-1ق ار‌دارد‌‌‌.‌

‌ ازه‌نحوه ‌آوردن ‌ رست ‌دولفه‌ی ‌اشم اک‌ ین ‌‌ی ‌اصل ‌دمصل ‌B-1ی ‌‌ ‌دولفه‌Bو ‌دمصل‌‌ ا ی

.در‌زی ‌توضیح‌داده‌شره‌است‌‌Iی‌رونره‌پایین

L(X)‌=دخمصات‌‌xی‌دمصل‌ت ین‌پیکسل‌ه ‌دولفه‌سمت‌چپ‌‌

R(X)‌=دخمصات‌‌xی‌دمصل‌ت ین‌پیکسل‌ه ‌دولفه‌سمت‌راست‌‌

CC1

CC2

CC3

CC4CC5

Page 127: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

012

‌ Start‌=دخمصات‌ش وع‌ ازه‌‌

‌ End‌=دخمصات‌پایان‌ ازه‌‌

ی‌دمصل‌هیچ‌اشم اک ‌ ا‌هم‌نرارنر‌ ق ار‌ اشر‌دو‌دولفه‌‌ ‌ اگ‌.

دمصل‌هیچ‌اشم اک ‌ ا‌هم‌نرارنر‌ی‌ ق ار‌ اشر‌دو‌دولفه‌‌ ‌‌ اگ.‌

‌:ی‌اشم اک ‌ ه‌صورت‌زی ‌است‌در‌صورت ‌که‌ش ط‌ الا‌ ق ار‌نباشر‌ ازه

‌ در‌نمیجیه‌‌‌ اگی ‌در‌غیی ‌ایین‌صیورت‌‌‌‌‌

.‌

نمیجه اگ‌ ‌ در ‌ ‌‌ ‌ ‌صورت ‌این ‌غی ‌در

.

ا‌ رست‌آوردن‌ا مرا‌و‌.‌آیری‌اشم اک ‌ رست‌د نیز‌ ا‌همین‌رو ‌ ازه‌‌Bی‌دمصل‌‌ ای‌دولفه

:آیر‌ رست‌د (‌5-5)ی‌‌از‌را طهدیزان‌اشم اک‌ی‌ ازه،‌‌انمسا

(5-5)‌‌‌‌‌‌

رونره‌ ا ‌‌ی‌دمصل‌پایین‌ی‌دمصل‌اصل ‌ ا‌دولفه‌ی‌اشم اک ‌ ای‌ه ‌دو‌دولفه‌در‌صورت ‌که‌ ازه

‌‌ی‌دمصل‌پایین‌دولفه‌، ود ‌جایگذاری‌د رونره و‌‌40-‌5شکل‌ این‌رو ‌جایگذاری‌در‌.شود‌ ین‌آنسا

رونره‌ ا‌دسمطیل‌ق دز‌و‌دو‌ی‌دمصل‌پایینها‌دولفهدر‌این‌شکل.‌نمایش‌داده‌شره‌است‌42-‌5شکل‌

‌.‌ی‌دمصل‌خط‌اصل ‌ ا‌فلش‌دشخص‌هسمنردولفه

Page 128: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

001

.شوداشم اک‌نراشمه‌و‌ ین‌آنسا‌جایگذاری‌د ‌"الف"ی‌دمصل‌نقطه‌ ا‌دو‌دولفه‌:40-‌5شکل‌

‌"نچه"جایگذاری‌نقطه‌قبل‌از‌‌:42-‌5شکل‌

یشم ین‌اشم اک‌را‌داشمه‌و‌قبل‌آن‌‌"نچه"،‌خودی‌دمصل‌ رنه‌نقطه‌ ا‌دولفه،‌42-‌5شکل‌در‌

‌.شودجایگذاری‌د

خطی متصل روی مولفه های جایگذاری روش 5-1-9

احممال‌را‌دارد‌که‌که‌ یشم ین‌ی‌دمصل‌اصل ‌‌دو‌دولفه(‌9-5)ی‌‌در‌این‌حالت‌ ا‌توجه‌ ه‌را طه

دو‌قبل‌یا‌ عر‌از‌‌،این‌دولفه‌دمصل‌یا‌ ایر‌ ین.‌شونر‌دشخص‌د ‌آنسا‌ اشر‌‌د وط‌ هی‌دمصل‌‌دولفه

های‌دمصل ‌های‌دمصل‌روی‌خط‌در‌واقع‌دولفهدنظور‌از‌دولفه.‌جایگذاری‌شودی‌دمصل‌اصل ‌دولفه

‌پیکسل ‌ عض ‌از ‌روی‌خط‌هسمنراست‌که ‌فاصله‌های‌آنسا ‌خط‌دارنریا ‌کم ‌ ا ‌ی‌ سیار ‌این‌. در

این‌قواعر‌ ه‌ت تیب‌.‌اسمفاده‌شره‌است‌،ز ان‌فارس ‌است‌قسمت‌از‌شش‌قاعره‌که‌د وط‌ ه‌ساخمار

‌ ‌دشخص‌هسمنر‌95-‌5شکل‌‌تا‌91-‌5شکل‌در ‌انجام‌د حله. ‌ت تیب‌ عر‌از ق ارگ فمن‌ی‌جایگذاری،

‌.دشخص‌شره‌است‌9تا‌‌0های‌دمصل‌ ا‌اعراد‌دولفه

‌حالت او ‌دولفه: ‌دولفهاگ ‌دو ‌ ا ‌ی‌دمصل‌ی‌دمصل اشم اک ‌B(CC1) وB-1 (CC3)اصل

CC1CC2

CC3

CC4

CC1

CC2

Page 129: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

000

‌داده‌د ‌جا ‌شودنراشمه‌ اشر‌ ین‌آنسا ‌فلش‌سبز‌رنگ‌دشخص‌هسمنردو‌دولفه. .‌ی‌دمصل‌اصل ‌ ا

‌ (91-‌5شکل‌)

.شودجایگذاری‌د ‌"و"و‌‌"ر"ی‌دمصل‌ ین‌دو‌دولفه‌"الف"ی‌دمصلدولفه:91-‌5شکل‌

این‌حالت‌ یا‌‌)ق ار‌دارد‌B-1ی‌دمصل‌ ین‌ا مرا‌و‌انمسای‌دولفه‌ی‌دمصلانمسای‌دولفه :حالت دوم

اشم اک‌نرارد؛‌در‌این‌حالیت‌ یین‌آنسیا‌جیا‌‌‌‌‌‌Bی‌دمصل‌و‌ ا‌دولفه(‌فلش‌سبز‌رنگ‌دشخص‌شره‌است

(90-‌5شکل‌.‌)شودداده‌د

.شودجایگذاری‌د ‌"د"و‌‌"الف" ین‌‌"ر"ی‌دمصلدولفه:90-‌5شکل‌

قی ار‌‌‌Bی‌دمصیل‌‌ ین‌ا مرا‌و‌انمسای‌دولفیه‌‌ی‌دمصلدولفه‌یا مرا عکس‌حالت‌ الا‌:حالت سوم

اشم اک‌نیرارد؛‌در‌ایین‌‌‌‌B-1ی‌دمصل‌و‌ ا‌دولفه(‌این‌حالت‌ ا‌فلش‌سبز‌رنگ‌دشخص‌شره‌است)دارد

‌‌(94-‌5شکل‌.‌)شودحالت‌ ین‌آنسا‌جا‌داده‌د

x

y

fitted curve

CC1

CC2CC3

x

y

fitted curve

CC2

CC3CC1

Page 130: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

004

‌.شودجایگذاری‌د ‌"سعا"و‌‌"ر" ین‌‌"الف"ی‌دمصلدولفه:94-‌5شکل‌

در‌این‌حالت‌ عیر‌‌.‌ی‌اصل ‌کلمه‌دورد‌نظ ‌استدمصل‌جا‌افماده‌جزء‌ رنهی‌دولفه:‌حالت چهارم

‌(99-‌5شکل‌.)شودی‌دمصل‌اصل ‌که‌دعمولا‌نقاط‌هسمنر‌جایگذاری‌د از‌دو‌دولفه

.شود عر‌از‌نقاط‌آن‌جایگذاری‌د ‌"شت"ی‌اصل ‌ رنه:99-‌5شکل‌

زرگم ‌است‌‌B(CC2) ی‌دمصل‌ی‌دمصل‌از‌طول‌دولفهدولفه‌طول‌در‌این‌حالت:‌حالت پنجم

ی‌دمصل‌قبل‌از‌دولفه.‌اشم اک ‌نرارد‌B-1(CC3) ی‌دمصل‌گی د‌و‌ ا‌دولفه ه‌طوریکه‌آن‌را‌در د

‌(95-‌5شکل‌).شودی‌اصل ‌جایگذاری‌د دولفهه ‌دو‌

.گی دق ار‌د ‌"در"و‌‌"الف"قبل‌از‌‌"ر"ی‌دمصل‌دولفه:95-‌5شکل‌

‌.گی دق ار‌د ‌B-1و‌‌‌Bی‌دمصلی‌دمصل‌ ین‌دولفهدر‌غی ‌از‌دوارد‌ الا،‌دولفه‌:حالت ششم

x

y

fitted curve

CC1

CC2

CC3

CC2

CC3

CC1

x

y

fitted curve

CC2

CC3

CC1

Page 131: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

009

جداسازی خطوط 5-5

‌انجام‌ دمصل‌دوجود‌در‌دمن‌ ه‌یک ‌از‌‌‌ه ‌دولفه‌،ی‌جایگذاری‌ ای‌تمام‌خطوط‌د حله عر‌از

‌ ا‌دولفهسپس‌د .‌خطوط‌اخمصاص‌پیرا‌ک ده‌است های‌دمصلش‌ ه‌طور‌دسمقل‌از‌‌توان‌ه ‌خط‌را

‌دا ق ‌خطوط‌نمایش‌داد ‌ اشر‌نمیجه‌این‌د حله‌جراسازی‌خطوط‌از‌یکریگ ‌د . تمام‌‌95-‌5شکل‌.

‌جایگذاری‌نشان‌د ‌دولفه ‌د حله ‌از ‌ عر ‌را ‌این‌شکل‌‌.دهر‌های‌دمصل‌خط‌اول ‌در های‌‌دولفهتمام

های‌دمصل‌این‌خط‌ ه‌ت تیب ‌که‌در‌دمن‌از‌‌و‌کل‌دولفهشره‌جایگذاری‌دمصل‌جا‌دانره‌از‌خط‌اول‌

نمیجه‌اج ای‌رو ‌و‌‌97-‌5شکل‌‌تا‌95-‌5شکل‌‌.شونرد ‌ذخی ه‌انر‌سمت‌راست‌ ه‌چپ‌ق ار‌گ فمه

‌.دهرجراسازی‌خطوط‌دمن‌از‌یگریگ ‌را‌نشان‌د

های‌دمصل‌جا‌دانره‌از‌خط‌اول‌‌جایگذاری‌دولفه:95-‌5شکل‌

نمیجه‌جراسازی‌خطوط‌دمن:95-‌5شکل‌

Page 132: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

005

نمیجه‌جراسازی‌خطوط‌دمن: 97-‌5شکل‌

تصویر کلمات متن برون خط استخراج 5-1

تا‌‌ی ‌ ا‌در‌نظ ‌گ فمن‌این‌قانون‌که‌اکث ‌ح وف‌اضافه‌و‌کلمات‌فارس ‌از‌ت کیب‌‌د حلهاین‌در‌

های‌دمصل‌ه ‌‌دولفه.‌شود‌انر‌اسمخ اج‌کلمات‌از‌داخل‌دمن‌انجام‌د ‌دمصل‌تشکیل‌شره‌ی‌هفت‌دولفه

دمصل‌‌ی‌از‌اولین‌دولفه.‌انر‌‌سمت‌چپ‌ذخی ه‌شرهت‌راست‌دمن‌ ه‌خط‌از‌نظ ‌دکان ‌ ه‌ت تیب‌از‌سم

‌ ه‌ت تیب‌ ای‌ساخمن‌ت کیب ‌دولفه‌،های‌دوتای ‌ه ‌خط‌ش وع‌ک ده‌و ‌تا انمخاب‌اول‌‌دمصل‌ی‌دو

داخل‌این‌‌.است‌در‌نظ ‌گ فمه‌شرهی‌سیاه‌هم‌ا عاد‌ ا‌تصوی ‌اصل ‌تصوی ی‌ ا‌زدینهسپس‌‌.انرشره

در‌واقع‌.‌شودی ‌ق ار‌داده‌د در‌دمن‌اصل ،‌‌ی‌دمصلدولفهد وط‌ ه‌دو‌های‌پیکسل‌در‌دکانتصوی ‌

‌.‌های‌دمصل‌سفیر‌هسمنردر‌این‌تصوی ‌دولفه

دو‌‌این‌شادل‌که‌تصوی یی‌دمصل،‌فقط‌توجه‌ ه‌ا عاد‌و‌دخمصات‌دو‌دولفهی‌ عری‌ ا‌در‌د حله

ها‌دمصل‌این‌خط‌‌این‌رو ‌تا‌آخ ‌ ای‌کل‌دولفه‌.شودد است‌از‌این‌تصوی ‌اسمخ اج‌دمصل‌‌ی‌دولفه

هفت‌تای ‌و‌ ای‌ت کیب‌سه‌تای ‌تا‌‌رو همین‌سپس‌.‌کنر‌ ا‌در‌نظ ‌گ فمن‌گام‌ی ‌اداده‌پیرا‌د

‌دوجوکه‌در‌دمن‌تای ‌تا‌هفت‌ی این‌ت کیبات‌در‌نسایت‌تصوی ‌تمام‌‌.شود‌ط‌اج ا‌د روی‌تمام‌خطو

‌د د ‌تصوی .شود‌ارنر‌ذخی ه ‌‌کلمه‌دوقعیت‌دکان ‌ه ‌در ای‌‌جسمجود حله‌داخل‌دمن‌اصل ‌در

Page 133: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

005

تصوی ،‌دوقعیت‌دکان ‌آن‌روی‌تصوی ‌اصل ‌‌از‌این‌رو‌ ا‌ذخی ه‌ه ‌. اشر‌د ‌لازم‌آنک دن‌دشخص‌

شره‌ه ‌‌گ فمه‌دزیت‌رو ‌ارائه‌شره‌این‌است‌که‌ ه‌دلیل‌اینکه‌گام‌ی ‌در‌نظ ‌.شودنیز‌ذخی ه‌د

سپس‌اگ ‌در‌.‌گی د‌دولفه‌دمصل ‌که‌آغاز‌کننره‌ی ‌کلمه‌است‌قطعا‌در‌ا مرای‌ی ‌ت کیب‌ق ار‌د

‌رخ‌نراده‌ اشر‌اسمخ اج‌‌ت تیب‌ق ار‌گ فمن‌دولفه ه‌‌آنهای‌دمصل ‌که‌در‌ت کیب‌وجود‌دارنر‌خطا

‌‌.شود‌درسم ‌انجام‌د

‌ ‌دثال‌در ‌طور ‌سمخ اج‌ت کیب ای‌ا‌90-‌5شکل‌ ه ‌پیکسلدکان‌های‌دوتای ، ی‌دولفههای‌دو

‌آیر رست‌د ‌92-‌5شکل‌در‌نظ ‌گ فمه‌شره‌است‌و‌تصوی ‌‌"هل"و‌‌"ا"دمصل‌ ‌توجه‌ ه‌. سپس‌ ا

‌.شوداسمخ اج‌د ‌92-‌5شکل‌از‌تصوی ‌‌"اهل"ی‌تصوی ‌شادل‌کلمه‌،مم‌زی الگوری

‌های‌دمصلدر‌نظ ‌گ فمن‌ت کیب‌دوتای ‌دولفه:90-‌5شکل‌

Page 134: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

005

‌ ا‌تصوی ‌اصل ‌انرازههای‌دمصل‌در‌تصوی ی‌هم‌آشکار‌ک دن‌ت کیب‌دولفه:92-‌5شکل‌

‌:شودالگوریمم‌زی ‌انجام‌د ه ‌تصوی ‌‌دوقعیت‌دکان ای‌ رست‌آوردن‌

.‌شودد های‌دمصل‌داخل‌ت کیب،‌چسار‌دخمصات‌دع ف ‌شره‌در‌زی ‌در‌نظ ‌گ فمه‌ ای‌دولفه

‌ ه ‌توجه ‌‌(5-5)‌یرا طه‌سپس‌ ا ‌تصوی ‌از ‌نظ شکل‌دخمصات‌دناسب‌ ای‌اسمخ اج‌ت کیب‌دورد

– Ybottom –Ytop |, | Xright|[‌ ه‌صورتطور‌که‌اشاره‌شر‌دوقعیت‌دکان ‌همان.‌آیر رست‌د ‌‌5-92

Xleft|[Xleft , Ytop , نمایش‌داده‌شره‌است‌51-‌5شکل‌این‌رو ‌در‌‌.شود ای‌ه ‌تصوی ‌ذخی ه‌د.

Ytop =دخمصات‌‌Yی‌دمصل‌ی‌سمت‌چپ‌ الا‌دولفهگوشه‌

Ybottom=دخمصات‌‌Yی‌دمصلسمت‌چپ‌پایین‌دولفهی‌گوشه‌

Xleft=دخمصات‌‌Xی‌دمصلی‌سمت‌چپ‌ الا‌دولفهگوشه‌

Xright=دخمصات‌‌Xی‌دمصلی‌سمت‌راست‌ الا‌دولفهگوشه‌‌

Page 135: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

007

‌‌‌‌

(5-5)‌

‌کلمه‌دوقعیت‌دکان ‌تصوی ‌ه ‌رو ‌ رست‌آوردن‌:51-‌5شکل‌

تیای ‌ ی ‌روی‌خیط‌‌‌‌‌5تا‌‌4های‌نمایج‌اج ای‌این‌رو ‌ ای‌ت کیب‌55-‌5شکل‌تا‌‌50-‌5شکل‌در‌

‌.انردشخص‌شره‌دای هکلمات‌ ا‌.‌اول‌نمایش‌داده‌شره‌است

Ytop2

Ybottom2 Xleft2

Xright2

Ytop1

Ybottom1 Xleft1

Xright1

Page 136: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

000

‌ شکل‌های‌دمصلهای‌دو‌تای ‌از‌دولفهت کیباسمخ اج‌:50-‌5شکل‌

‌‌های‌دمصلتای ‌از‌دولفه‌سههای‌اسمخ اج‌ت کیب:54-‌5شکل‌

Page 137: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

002

‌های‌دمصلتای ‌از‌دولفه‌چسارهای‌اسمخ اج‌ت کیب:‌59-‌5شکل‌

‌های‌دمصلتای ‌از‌دولفه‌پنچهای‌اسمخ اج‌ت کیب:‌55-‌5شکل‌

Page 138: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

041

نتایج روش پیشنهادی 5-7

اسمفاده‌شره‌دع ف ‌شر‌‌چسارم‌فصلکه‌در‌‌‌FHT ای‌ارزیا ‌رو ‌پیشنسادی‌از‌پایگاه‌داده‌

‌است ‌ یان‌شر‌. دسمه‌دمن‌‌51 اشر‌که‌دارای‌‌‌سنر‌د ‌0111این‌پایگاه‌داده‌شادل‌همان‌طور‌که

‌دمفاوت‌نوشمه‌شره‌45دمفاوت‌است‌که‌توسط‌ ‌انر‌نویسنره ‌ه ‌دسمه‌‌قسمت ای‌ارزیا ‌این‌. از

ی‌نوشمه‌شرن‌خطوط‌از‌‌تا‌ ا‌در‌نظ ‌گ فمن‌تنوع‌از‌جست‌کج‌و‌افق ‌ ودن‌خطوط‌و‌فاصله‌‌5،دمن

‌کم‌است‌انمخاب‌شره در‌این‌اسناد‌از‌نظ ‌‌. اشر‌سنر‌د ‌051انر‌که‌در‌دجموع‌‌هم‌که‌دموسط‌یا

خط‌خوانا‌دستشادل‌هم‌اسناد‌این‌.‌های‌کوچ ‌و‌ زرگ‌و‌دموسط‌وجود‌داردخطانرازه،‌انواع‌دست

‌و‌ ر‌خط‌استخط‌و‌هم‌غی و‌خو ‌خوانا ‌انرازه‌ول ‌رو ‌پیشنسادی‌دسمقل‌از‌نوع‌دست. خط‌و

‌.‌است

‌اسمخ ‌رو ‌پیشنسادی ‌قسمت‌جراسازی‌خطوط‌و ‌دو ‌دولفه‌اج‌ ون‌خط‌دنبالهدر های‌ای‌از

‌است ‌گ فمه ‌ارزیا ‌ق ار ‌در‌.دمصل‌دورد ‌آشکارسازی‌که ‌ن خ ‌[55‌،57] ای‌جراسازی‌خطوط‌از

‌د ‌تع یف‌شره ‌شود‌اسمفاده ‌اشم اک‌ ین‌دجموعه‌پیکسل. ‌اگ های‌خط‌صحیح‌و‌‌طبق‌این‌دعیار

درصر‌ یشم ‌‌21های‌دو‌دجموعه‌از‌‌تقسیم‌ ‌اجمماع‌ ین‌پیکسل‌،ی‌دمناظ ‌ ا‌آن‌درهآخط‌ رست‌

‌است ‌ اشر‌خط‌درست‌اسمخ اج‌شره .‌ ‌ ی‌‌دهنره‌نشانG ،(5-5)‌ی‌را طهدر خط‌‌Rخط‌صحیح‌و

‌آن‌است‌ رست‌آدره ‌ ا ‌نشان‌‌ ‌Mهای‌پیش‌زدینه‌و‌دجموعه‌پیکسل‌ P.ی‌دمناظ دیزان‌انطبا ‌را

.دهر‌د

(5-5)‌

‌آزدایش‌های‌تعراد‌کل‌خط ‌ الا‌‌‌0150دورد ‌طبق‌دعیار خط‌درست‌اسمخ اج‌‌0155است‌که

‌پایان‌نادهدزیت‌رو ‌دع ف ‌شره‌در‌این‌‌.درصر‌است%‌5/22ن خ‌آشکارسازی‌‌ انر‌که‌دعادل‌ ا‌شره

اشنر‌و‌یا‌خطوط‌‌توان‌ ه‌این‌صورت‌ یان‌ک د‌که‌ ای‌دمون ‌که‌داری‌خطوط‌تا‌حری‌کج‌د ‌را‌د

‌فاصله ‌شره‌ ا ‌نوشمه ‌هم ‌از ‌کم ‌د ‌ی ‌ارائه ‌قبول ‌قا ل ‌نمایج ‌نیز ‌د حله‌.کنر‌انر ‌در ‌خطا ی‌ایجاد

Page 139: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

040

‌جراسازی‌خطوط‌و‌جایگذاری‌؛شود‌عادل‌د وط‌د ه‌دو‌خط‌تصاوی ‌کلمات‌اسمخ اج‌ ون یشم ‌.

‌د ‌رخ ‌خطوط ‌جراسازی ‌د حله ‌در ‌که ‌است‌خطای ‌نقاط ‌ ه ‌د وط ‌دهر ‌در‌. ‌اشمباه ‌واقع ‌در که

‌د ‌،اخمصاص‌ی ‌نقطه‌ ه‌ی ‌خط در‌قسمت‌جایگذاری‌هم‌ ا‌‌.کنر‌در‌این‌قسمت‌هم‌ایجاد‌خطا

ا‌ادکان‌این‌که‌‌،نویس‌ سیار‌دمنوع‌استستتوجه‌ ه‌این‌نحوه‌نگار ‌فارس ‌ خصوص‌در‌دمون‌د

اشر‌‌شره‌یگذاریدولفه‌دمصل ‌در‌دکان‌اشمباه‌جا‌،5-5توجه‌ ه‌قواعر‌در‌نظ ‌گ فمه‌شره‌در‌ خش‌

‌د حله‌.وجود‌دارد ‌در ‌ایجاد‌شره ‌افماده‌ی‌دمصل‌دهر‌که‌دولفهزدان ‌رخ‌د ‌ی‌جایگذاریخطا جا

ی‌دولفهت تیب‌جایگذاری‌آن‌ ه‌شکل ‌ اشر‌که‌و‌‌نظ ‌ اشری‌دورد‌د وط‌ ه‌ش وع‌و‌یا‌انمسای‌کلمه

در‌اداده‌چنر‌دورد‌از‌.‌شناسای ‌شونر‌آن‌ی‌ عری‌یا‌قبل ‌است‌زودت ‌ازدمصل ‌که‌د وط‌ ه‌کلمه

‌.خطاهای‌ وجود‌آدره‌نشان‌داده‌شره‌است

‌سبز‌دشخص‌اس‌" ینیمد "ی‌ی‌کلمهنقطه‌55-‌5شکل‌در‌ ی‌جایگذاری‌ ه‌ت‌در‌د حلهکه‌ ا

زی ین‌نزدیکم ‌(‌خط‌ق دز‌رنگ)‌ی‌خطی‌اصل ‌نوشمه‌شره‌است‌ ه‌دعادلهدلیل‌اینکه‌ ا‌فاصله‌از‌ رنه

‌(.55-‌5شکل‌).کنر ه‌این‌خط‌اخمصاص‌پیرا‌د ‌، ه‌همین‌دلیل‌این‌نقطه‌ ه‌اشمباه.‌است

Page 140: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

044

پایهی‌خط‌ ا‌دعادله‌" ینیمد "ی‌ی‌نقطهنمایش‌فاصله:‌55-‌5شکل‌

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

ی‌خط‌زی ین ا‌دعادله‌" ینیمد "ی‌ی‌نقطهنمایش‌فاصله:‌55-‌5شکل‌

سیار‌کشیره‌و‌ ا‌فاصله‌از‌‌‌"که"این‌خط‌و‌اینکه‌س کش‌ح ف‌‌ ه‌اشمباه‌در‌اخمصاص‌این‌نقطه

‌است رنه ‌شره ‌نوشمه ‌ اعث‌د ‌ی‌اصل ‌خود ‌ا‌"که"ی‌ح ف‌اضافهجایگذاری‌شود ‌انجام‌نیز شمباه

-رونره‌دحسوب‌د ی‌دمصل‌ الا ای‌خط‌زی ین‌خود‌دولفه‌" ینیمد "ی ا‌توجه‌ ه‌اینکه‌نقطه.‌شود

ی‌ی‌دمصل‌نقطه‌و‌ عر‌از‌آن‌دولفها مرا‌دولفه‌.شودجایگذاری‌د ‌0-5-5شود‌ ا‌توجه‌ ه‌قواعر‌ خش

ی‌دمصل‌خط‌اصل ‌که‌ ه‌پنج‌دولفه‌50-‌5شکل‌‌و‌57-‌5شکل‌در‌‌.شونردمصل‌س کش‌جایگذاری‌د

ی‌دمصل ‌که‌ ا‌فلش‌دولفه‌.انرشرهنزدی ‌هسمنر‌دشخص‌رونره‌نقطه‌و‌س کش‌های‌دمصل‌ الادولفه

‌افماده‌دولفهی‌دمصل‌اصل ‌ ه‌دولفهسبز‌رنگ‌دشخص‌است‌نزدیکم ین‌ ‌استی‌دمصل‌جا ی‌دولفه.

های‌ت تیب‌کل ‌ق ار‌گ فمن‌دولفه‌52-‌5شکل‌در‌نسایت‌در‌.‌گی دار‌د دمصل‌ الارونره‌قبل‌از‌آن‌ق

‌‌.دمصل‌دشخص‌شره‌است

x

y

fitted curve

x

y

fitted curve

Page 141: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

049

‌ی‌دمصل‌نقطهجایگذاری‌دولفه:‌57-‌5شکل‌

‌س کشی‌دمصل‌جایگذاری‌دولفه:‌50-‌5شکل‌

های‌دمصل‌پشت‌س ‌هم‌ عر‌از‌جایگذاری‌نقطه‌و‌س کشت تیب‌ق ار‌گ فمن‌دولفه:‌52-‌5شکل‌

اشر‌که‌از‌این‌تعیراد‌‌‌د ‌9011و‌تعراد‌کل‌ح وف‌اضافه‌‌‌09010دورد‌آزدایش‌تعراد‌کل‌کلمات

ی ای‌کلمیات‌‌‌‌%95/25انر‌که‌دعادل‌ ا‌درصر‌دقت‌‌ح ف‌اضافه‌ ه‌درسم ‌آشکار‌نشره‌00و‌کلمه‌‌792

دیزان‌ایجاد‌خطا‌توسط‌دو‌عادل‌ الا‌را‌ ه‌تفکی ‌نشیان‌‌‌0-‌5جرول‌.‌ ای‌ح وف‌اضافه‌است‌%5/27و‌

در‌این‌جرول‌در‌سط ‌اول‌تعراد‌کلمات ‌ق ار‌دارنر‌که‌ ‌اث ‌جایگذاری‌اشمباه‌دولفیه‌دمصیل ‌‌‌.‌دهر‌د

در‌سط ‌دوم‌کلمات ‌که‌ ‌اث ‌جایگذاری‌اشمباه‌نقیاط‌‌.‌انر‌که‌جز‌ رنه‌اصل ‌کلمه‌است‌دچار‌خطا‌شره

و‌ ه‌همین‌ت تیب‌در‌سط ‌سوم‌کلمات ‌که‌ ‌اث ‌اشمباه‌در‌اخمصاص‌ی ‌نقطیه‌ یه‌‌‌انر‌‌دچار‌خطا‌شره

‌.دهر‌انر‌را‌نشان‌د ‌دچار‌خطا‌شره‌ی ‌خط‌

x

y

fitted curve

CC2

CC1

CC4CC5

CC3

x

y

fitted curve

CC1CC2

CC4

CC5

CC3

1

23

45

6

7

8

910

Page 142: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

045

دیزان‌ایجاد‌خطا‌توسط‌دو‌عادل‌ الا‌:0-‌5جرول‌

‌درصر‌ایجاد‌خطا‌تعراد‌کلمات‌عادل‌ایجاد‌خطا

اشمباه‌جایگذاری‌

‌ رنه‌اصل

500‌5/55‌

جایگذاری‌اشمباه‌

‌نقاط

50‌0/7‌

جراسازی‌اشمباه‌

‌خطوط‌در‌نقاط

471‌5/95‌

،‌که‌ ا‌رو ‌پیشنسادی‌خطوط‌دمن‌آنسا‌ یه‌درسیم ‌شناسیای ‌شیره‌‌‌‌در‌اداده‌چنر‌سنر‌تصوی ی‌

‌(59-‌5شکل‌‌تا‌51-‌5شکل‌).‌نشان‌داده‌شره‌است

دمن‌ ا‌ کارگی ی‌رو ‌پیشنسادیجراسازی‌خطوط‌:51-‌5شکل‌

Page 143: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

045

‌دمن‌ ا‌ کارگی ی‌رو ‌پیشنسادیجراسازی‌خطوط‌‌:50-‌5شکل‌

‌دمن‌ ا‌ کارگی ی‌رو ‌پیشنسادیجراسازی‌خطوط‌‌:54-‌5شکل‌

Page 144: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

045

کارگی ی‌رو ‌پیشنسادی‌جراسازی‌خطوط‌دمن‌ ا‌‌:59-‌5شکل‌‌

عملک د‌رو ‌پیشنسادی‌در‌دیورد‌دمیون ‌کیه‌دارای‌خطیوط‌کیج‌‌‌‌‌‌‌52-‌5شکل‌تا‌‌55-‌5شکل‌ در

‌.انر‌نمایش‌داده‌شره‌استی‌کم‌از‌هم‌نوشمه‌شرهخطوط‌ ا‌فاصلهیا‌هسمنر‌

‌انر‌عملک د‌رو ‌پیشنسادی‌در‌دورد‌خطوط‌دمن‌که‌تا‌حری‌کج‌نوشمه‌شره:‌55-‌5شکل‌

Page 145: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

047

انر‌ الا‌که‌ ه‌درسم ‌جرا‌شرهسه‌خط‌اول‌دمن‌:‌55-‌5شکل‌

‌انر‌خ ‌دمن‌ الا‌که‌ ه‌درسم ‌جرا‌شرهآچسار‌خط‌:55-‌5شکل‌

‌.انر‌شره‌عملک د‌رو ‌پیشنسادی‌در‌دورد‌خطوط‌دمن ‌که‌ ا‌فاصله‌کم‌از‌هم‌نوشمه‌:‌57-‌5شکل‌

Page 146: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

040

.انر‌سه‌خط‌اول‌دمن‌ الا‌که‌ ه‌درسم ‌جرا‌شره‌:50-‌5شکل‌

.انر‌خ ‌دمن‌ الا‌که‌ ه‌درسم ‌جرا‌شرهآسه‌خط‌:‌52-‌5شکل‌

قادر‌ ه‌جراسازی‌خطوط‌در‌دورد‌آنسا‌نبوده‌اسیت‌‌دو‌نمونه‌از‌اسناد‌تصوی ی‌که‌رو ‌پیشنسادی‌

یه‌‌‌5و‌‌5هیای‌دمصیل‌خیط‌‌‌‌‌دولفیه‌‌51-‌5شکل‌در‌.‌انرنمایش‌داده‌شره‌50-‌5شکل‌و‌‌51-‌5شکل‌‌در

همه‌ ه‌عنیوان‌‌‌،خط‌ ه‌یکریگ ‌های‌دمصل‌این‌دو‌دولفهم‌رفمگ ‌شریر‌خطوط‌و‌اتصال‌ ین‌ه‌دلیل‌تو

شره‌انر‌که‌ اعث‌عرم‌تشخیص‌جراگانه‌این‌دو‌خط‌از‌هم‌‌شره‌‌تشخیص‌داده‌5خط‌‌دمصل‌های‌دولفه

رو ‌قیادر‌‌‌یکیریگ ،‌ی‌نزدیی ‌خطیوط‌ یه‌‌‌‌ ه‌دو‌دلیل،‌کج ‌خطیوط‌و‌فاصیله‌‌‌50-‌5شکل‌در‌‌.است

‌.نشره‌است‌جراسازی‌خطوط

Page 147: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

042

های‌دمصل‌اتصال‌ ین‌دولفههای‌دمصل‌د وط‌ ه‌ه ‌خط‌ ه‌دلیل‌‌عرم‌توانای ‌تشخیص‌دولفه:‌51-‌5شکل‌

‌خطوط

ی‌کم‌خطوط‌از‌‌فاصلههای‌دمصل‌د وط‌ ه‌ه ‌خط‌ ه‌دلیل‌کج ‌زیاد‌و‌‌عرم‌توانای ‌تشخیص‌دولفه:‌50-‌5شکل‌

‌هم

Page 148: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

091

5 ‌

Page 149: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

090

:ششمفصل

گیری و پیشنهاداتنتیجه

Page 150: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

094

هیای‌ز یان‌فارسی ‌‌‌‌‌نوشمه‌ی ‌رهیافت‌جسمجوی‌کلمه‌ ای‌دستپایان‌ناده‌‌این‌رو ‌پیشنسادی

در‌ایین‌‌‌.است‌که‌هرف‌آن‌یافمن‌ی ‌کلمه‌پ سش ‌در‌ی ‌دجموعه‌داده‌شادل‌اسناد‌تصیوی ی‌اسیت‌‌

آن‌کلمیه‌در‌‌ هیای‌‌و‌دکان‌نمونیه‌جسمجو‌شره‌ پ سش ‌دورد‌نظ ‌کار ‌در‌اسناد‌تصوی یی‌‌رو ‌کلمه

‌‌.ی‌دمن ‌کلمه‌ اشرتوانر‌ صورت‌تصوی ‌یا‌رشمهپ سش‌د .شود‌داخل‌اسناد‌دشخص‌د

ای‌ایین‌‌.‌ونرکلمات‌دوجود‌در‌اسناد‌تصوی ی‌اسمخ اج‌شاین‌سیسمم‌در‌اولین‌گام‌لازم‌است‌در‌

ا‌در‌نظی ‌گی فمن‌اینکیه‌در‌‌‌‌‌سپس‌.انرشره‌اسمخ اجهای‌دمصل‌دوجود‌در‌دمن‌‌فها مرا‌کل‌دولد حله‌

ی‌دمصل ‌که‌دخمصات‌د کز‌آن‌دارای‌ یشیم ین‌‌‌دولفه‌؛شود‌فارس ‌از‌ الا‌سمت‌راست‌نوشمن‌آغاز‌د

ی‌در‌نظی ‌گ فمیه‌شیره‌ یشیم ‌‌‌‌‌‌است‌و‌تعراد‌پیکسل‌های‌آن‌از‌ی ‌آسمانه‌yو‌کمم ین‌دقرار‌‌ xدقرار

تی ین‌دولفیه‌‌‌‌نزدیی ‌‌.گی دد‌‌انمخاب‌دی ‌که‌ش وع‌کننره‌خط‌است‌‌ ی‌دمصل‌دولفه ه‌عنوان‌‌، اشر‌د

‌xدخمصیات‌‌.0)‌شیود‌‌دمصل‌در‌دمن‌ ه‌این‌دولفه‌دمصل‌اولیه‌ ا‌در‌نظ ‌گ فمن‌دو‌ش ط‌انمخیاب‌دی ‌‌

قیرر‌دطلیق‌‌‌.‌4د کز‌دولفه‌دمصل‌اولیه‌کممی ‌ اشیر‌‌‌xت ین‌دولفه‌دمصل‌ ایر‌از‌دخمصات‌‌د کز‌نزدی

یا‌اعمیال‌رو ‌‌‌.‌(نظی ‌گ فمیه‌شیره‌کممی ‌ اشیر‌‌‌‌‌‌‌د اکز‌آنسا‌از‌ی ‌آسیمانه‌در‌‌yدخمصاتف‌ ین‌اخملا

ه‌های‌دمصل‌خط‌ صورت‌ی ‌زنجیزه‌و‌‌ت ین‌همسایه‌و‌در‌نظ ‌گ فمن‌دو‌ش ط‌ الا‌تمام‌دولفه‌نزدی

ه‌هی ‌‌های‌دمصل‌د وط‌ عر‌از‌ رست‌آدرن‌دولفه‌.آینرهمان‌ت تیب ‌که‌در‌دمن‌ق ار‌دارنر‌ رست‌د

‌.‌شودپ دازش ‌روی‌آنسا‌انجام‌د عملیات‌پسخط‌

ی‌قبیل‌‌که‌در‌د حلیه‌است‌های‌دمصل ‌حذف‌دولفه ی‌خط‌ویافمن‌دعادلهپ داز ‌شادل‌این‌پس

ی‌خیط‌از‌‌ی‌ه ‌دولفه‌دمصل‌ ا‌دعادلیه‌‌اگ ‌فاصلهدر‌این‌د حله‌‌.انراشمباها‌ ه‌خط‌اخمصاص‌داده‌شره

عیر‌‌.‌شود‌حذف‌د ‌آنی ‌حر‌آسمانه‌ یشم ‌ ود‌این‌دولفه‌دمصل‌د وط‌ ه‌این‌خط‌نبوده‌و‌از‌لیست‌

حیذف‌‌‌های‌دمصل‌دیمن‌خط‌از‌لیست‌کل‌دولفهاین‌نسای ‌های‌دمصل‌دولفه‌،پ داز از‌انجام‌این‌پس

ل‌از‌هیای‌قبی‌‌‌خط‌ذفشود‌تا‌ه ‌ ار‌ی ‌خط‌ ا‌ح‌این‌الگوریمم‌ ه‌تعراد‌خطوط‌دمن‌انجام‌د ‌.شونرد

‌.های‌دمصل‌د وط‌ ه‌آن‌دشخص‌شونرخود ‌دورد‌پ داز ‌ق ار‌گی د‌و‌دولفه

Page 151: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

099

های‌دمصل ‌ اق ‌خواهنر‌دانر‌کیه‌ یه‌‌‌تمام‌خطوط‌دمن،‌دولفه‌روی‌این‌الگوریمم‌ ‌اج ای عر‌از‌‌

عبارت‌دیگی ‌‌ ه‌.‌شونرکه‌ ا‌پیرا‌ک دن‌دکان‌آنسا‌در‌دمن،‌جایگذاری‌د انر‌هیچ‌خط ‌اخمصاص‌نیافمه

خطی ‌اخمصیاص‌‌‌‌چی‌قبل ‌ یه‌هیی‌‌های‌دمصل ‌که‌در‌د حله‌در‌د حله‌جایگذاری‌در‌دورد‌تمام‌دولفه

این‌در‌.‌انر‌ها‌و‌نقاط‌تشکیل‌داده‌س کشهای‌دمصل‌را‌‌ یشم ‌این‌دولفه.‌شود‌گی ی‌د ‌انر‌تصمیم‌نیافمه

و‌جیاروب‌افقی ‌‌‌‌ی‌دمصیل‌هی ‌دولفیه‌‌‌x،‌ ا‌در‌نظ ‌گ فمن‌ی ‌نوار‌سمون ‌ ا‌د کزیت‌دخمصات‌د حله

-این‌دولفیه‌‌yتشکیل‌خواهر‌شر‌که‌دخمصات‌تصوی ‌شادل‌دعادلات‌خطوط،‌ ه‌تعراد‌خطوط‌دمن‌قله‌

عر‌از‌دشیخص‌شیرن‌خیط،‌ یا‌ییافمن‌‌‌‌‌‌‌.ی‌دمصل‌ ه‌ه ‌قله‌که‌نزدیکم ‌ ود‌ ه‌آن‌خط‌اخمصاص‌دارد

‌.شودقبل‌یا‌ عر‌از‌آنسا‌جایگذاری‌د ‌، ینی‌دمصل‌این‌دولفههای‌دمصل‌خط‌اصل ،‌نزدیکم ین‌دولفه

تیا‌هفیت‌دولفیه‌‌‌‌‌یی ‌ ا‌در‌نظ ‌گ فمن‌این‌قانون‌که‌اکث ‌ح وف‌اضافه‌و‌کلمات‌فارس ‌از‌ت کیب‌

یه‌‌‌های‌دمصل‌ه ‌خط‌از‌نظ ‌دکیان ‌‌دولفه‌.شود‌انر‌اسمخ اج‌کلمات‌دمن‌انجام‌د ‌دمصل‌تشکیل‌شره

از‌اولین‌دولفه‌دمصل‌ه ‌خط‌شی وع‌کی ده‌و‌‌‌‌.انر‌‌سمت‌چپ‌ذخی ه‌شرهت‌راست‌دمن‌ ه‌ت تیب‌از‌سم

دو‌تا‌دولفه‌دمصل‌اول‌را‌در‌نظ ‌گ فمیه‌و‌تصیوی ی‌شیادل‌‌‌‌‌،های‌دوتای ‌ ه‌ت تیب‌ ای‌ساخمن‌ت کیب

ا عاد‌این‌تصوی ‌ ا‌توجه‌ ه‌دخمصات‌ایین‌دو‌دولفیه‌دمصیل‌تعییین‌‌‌‌‌‌.آیره ‌دو‌دولفه‌دمصل‌ رست‌د

دمصل‌این‌خط‌ یا‌در‌نظی ‌گی فمن‌گیام‌یی ‌ادادیه‌پییرا‌‌‌‌‌‌‌‌ها‌‌این‌رو ‌تا‌آخ ‌ ای‌کل‌دولفه.‌شودد

شود‌و‌در‌نساییت‌‌‌همین‌د احل‌ ای‌ت کیب‌سه‌تای ‌تا‌هفت‌تای ‌و‌روی‌تمام‌خطوط‌اج ا‌د .‌کنر‌د

های‌دمصل ‌که‌د وط‌ ه‌یی ‌کلمیه‌‌‌‌دولفه‌.شود‌دارنر‌ذخی ه‌د ‌تصوی ‌تمام‌کلمات ‌که‌در‌دمن‌وجود

‌.‌انر‌ ‌که‌در‌کلمه‌وجود‌دارنر‌ ا‌این‌رو ‌شناسای ‌شرهدسمقل‌در‌دمن‌هسمنر‌ ه‌همان‌ت تیب

.‌ی‌فارس ‌ارزییا ‌شیره‌اسیت‌‌‌نوشمهسنر‌تصوی ی‌دست‌051ای‌شادل‌این‌رو ‌روی‌پایگاه‌داده

درصر‌دقیت‌در‌د حلیه‌اسیمخ اج‌‌‌‌.‌ اشر‌د ‌%5/22ن خ‌آشکارسازی‌در‌د حله‌جراسازی‌خطوط‌ ا ‌ ا‌

رو ‌فیو ‌در‌‌‌. ای‌ح وف‌اضیافه‌اسیت‌‌%‌5/‌27 ای‌کلمات‌و‌‌%95/25های‌دمصل،‌‌ای‌از‌دولفه‌دنباله

Page 152: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

095

انر‌عملک د‌قا ل‌قبیول ‌‌‌دمون ‌که‌دارای‌خطوط‌افق ‌و‌کج‌هسمنر‌و‌یا‌ ا‌فاصله‌کم ‌از‌هم‌نوشمه‌شره

انیر‌و‌ییا‌‌‌‌ی‌کم ‌از‌هم‌نوشمه‌شیره‌‌یک ‌از‌دشکلات‌رو ‌در‌دمون ‌است‌که‌خطوط‌کج‌ ا‌فاصله.‌دارد

‌.خطوط‌اتصال‌وجود‌دارددمصل‌‌های‌‌ ین‌دولفه

ای‌از‌کلمات‌کانریر،‌ایجاد‌شره‌که‌در‌گام‌ عیری‌هیرف‌ییافمن‌‌‌‌در‌نمیجه‌ عر‌از‌گام‌اول‌دجموعه

ی‌دجموعهاین‌.‌ اشرهای‌کلمات‌پ سش ‌در‌این‌دجموعه‌و‌دشخص‌ک دن‌دکان‌آنسا‌در‌دمن‌د نمونه

در‌یی ‌فضیای‌‌‌‌کلمیات‌پ سشی ‌‌های‌دمن ‌دمناظ ‌ یا‌‌‌ ه‌هم اه‌تصاوی ‌کلمات‌پ سش ‌و‌رشمه‌کانریر

از‌ی‌ی‌پ سشی ،‌و‌تصیاوی ‌‌‌ی‌دمنی ‌کلمیه‌‌‌رشمه‌و‌تصوی ‌در‌این‌فضا،‌.شونرد ‌تعبیه داری‌دشم ک‌

یا‌‌.‌گی نیر‌‌ریگ ‌قی ار‌دی ‌‌کدهنر‌نزدی ‌ ه‌ی‌را‌نشان‌د ‌ ی‌یکسان‌که‌کلمه‌،ی‌کانریردجموعهکلمات‌

‌.ودش‌ت ین‌همسایگ ‌عملیات‌تشخیص‌انجام‌د ‌نزدی نری‌طبقهرو ‌

کیه‌‌‌شیود‌ای‌ ه‌نام‌هیسموگ ام‌ه د ‌ح وف‌اسمفاده‌دی ‌از‌دشخصه،‌های‌دمن ازنمای ‌رشمه ای‌‌

گی ی‌این‌نوع‌دشخصیه‌‌ ه‌کار‌.کنردر‌فضای‌ این ی‌ ه‌نام‌فضای‌ چسب‌تعبیه‌د را‌ی‌دمن ‌هارشمه

شیود‌کیه‌‌‌د دنج ‌ ه‌روش ‌و‌‌شباهت‌ ین‌کلمات‌دسمقل‌از‌شیوه‌نگار ‌حفظ‌شود‌شود‌که اعث‌د

در‌‌انیر‌در‌واقع‌الگوریمم‌قادر‌است‌ ای‌کلمات ‌کیه‌آدیوز ‌نرییره‌‌‌‌. دها‌ س ه‌د از‌دانش‌ ین‌کلاس

از‌ دارهای‌فیش ‌ ه‌عنیوان‌‌‌.ی‌آزدون‌عملیات‌جسمجو‌را‌انجام‌دهر‌و‌نمایج‌دناسب ‌داشمه‌ اشرد حله

سیپس‌ایین‌‌‌‌.شیونر‌وی ‌اسمخ اج‌د انمایش‌پایه‌تصوی ‌اسمفاده‌شره‌است‌و‌ دارهای‌ویژگ ‌ ای‌تص

یا‌در‌‌.‌رونیر‌ها‌ ه‌کار‌دی ‌دمناظ ‌ ای‌آدوز ‌دشخصه‌PHOCهای‌ دارهای‌ویژگ ‌ ه‌هم اه‌ چسب

دشخصه‌وجود‌دارد‌که‌ ای‌آدوز ‌آنسیا‌از‌‌‌PHOC‌،555نظ ‌گ فمن‌الفبای‌فارس ‌و‌اسمفاده‌از‌رو ‌

SVMی‌شخصه ه‌عبارت‌دیگ ‌ ای‌آدوز ‌د.‌خط ‌اسمفاده‌شره‌است‌iُهیای‌‌نمونهای‌از‌م‌،‌دجموعها

اشینر‌‌کلمات ‌هسمنر‌که‌دارای‌این‌دشخصه‌د ‌های‌دثبت،نمونه.)شونرو‌دنف ‌آن‌اسمفاده‌د ‌دثبت

های‌دنف ‌که‌دارای‌ایین‌‌ی ‌ق ار‌گ فمه‌و‌ ای‌نمونههیسموگ ام‌ام‌i‌ُ عُرها‌در‌در‌واقع‌ ای‌این‌نمونه

ها‌دنج ‌ ه‌ایجیاد‌فضیای ‌ یه‌نیام‌فضیای‌‌‌‌‌‌آدوز ‌دشخصه‌.(ق ار‌داردامُ‌صف ‌‌i عُردشخصه‌نیسمنر‌در‌

Page 153: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

095

انیر‌‌دمفیاوت‌هیای‌‌خیط‌ی‌یکسان‌ ا‌دستکه‌در‌این‌فضا‌تصاوی ‌کلمات ‌که‌ی ‌کلمهشود‌د دشخصه‌

‌‌.گی نرنزدی ‌ ه‌یگریگ ‌ق ار‌د

سیمگ ‌کیانون ‌ ی ای‌تصیحیح‌دقیادی ‌‌‌‌‌‌در‌نسایت‌از‌ی ‌رو ‌کالیب ه‌ک دن‌ یه‌نیام‌تحلییل‌هیم‌‌‌‌

و‌‌هیا‌رتبه‌دشخصیه‌ ا‌اسمفاده‌از‌این‌رو ‌‌.ها‌ س ه‌ ده‌که‌دنج ‌ ه‌اصلاح‌ سم ‌نمایج‌شره‌است‌یژگ و

ضا‌همبسمگ ‌ ین‌آنسیا‌‌شونر‌که‌در‌این‌فدر‌ی ‌فضای‌ داری‌دشم ک‌تعبیه‌د ‌PHOCهای‌ چسب

‌.شود‌ت ین‌همسایگ ‌عملیات‌تشخیص‌انجام‌د ‌نزدی نری‌طبقه ا‌رو ‌داکزیمم‌است‌و‌

هیای‌دمفیاوت‌‌‌خطشادل‌تصاوی ‌کلمات‌ ا‌دستکه‌ ای‌ارزیا ‌این‌الگوریمم‌از‌دو‌پایگاه‌داده‌فارسا‌

های‌دمفاوت‌اسیت‌‌خطی‌فارس ‌که‌شادل‌اسناد‌تصوی ی‌ ا‌دستدمن‌دست‌نوشمه‌پایگاه‌دادهاست‌و‌

و‌فضیای‌ ی داری‌‌‌‌دشخصیه‌‌فضای‌آدوز ‌.ی‌آدوز ‌و‌آزدون‌اسمفاده‌شره‌استد حله ای‌‌ ه‌ت تیب

‌ی‌پ سشی ‌ییا‌‌ی‌آزدون‌ ا‌تاییپ‌کلمیه‌‌و‌در‌د حله.‌سا‌انجام‌شری‌فار ا‌اسمفاده‌از‌پایگاه‌داده‌دشم ک

‌.شوددر‌دمون‌دشخص‌د کلمه‌های‌آن‌ ه‌عنوان‌ورودی،‌دکان‌نمونهتصوی آن‌

‌ ‌روی‌دمون‌ز ان‌لاتین‌ارائه‌شره‌است قات‌تحقی‌و‌ یشم ‌تحقیقات‌انجام‌شره‌در‌این‌زدینه

ا‌.‌هم‌ ‌روی‌اسناد‌چاپ ‌هسمنر‌ساآناکث ‌ سیار‌کم‌د ‌ اشر‌که‌انجام‌شره‌در‌ز ان‌فارس ‌و‌ع ‌

‌نشره‌است،‌این‌پایان‌ناده‌فارس ‌انجام‌‌ینوشمهدست‌روی‌دمون‌توجس ‌در‌‌کار‌قا لتوجه‌ ه‌اینکه‌

‌دارد ‌زدینه ‌این ‌در ‌دناسب ‌نمایج .‌ ‌تصوی ، ‌ ا ‌پ سش ‌حالت ‌ ای ‌دقرار ‌‌F1 یشم ین ی‌آسمانهدر

و‌دیزان‌‌%55/75 اشر‌که‌در‌این‌آسمانه‌دیزان‌دقت‌د %55/74 رست‌آدره‌است‌که‌ ا ‌ ا‌‌2545/1

‌انمخاب‌د .است‌%54/01ف اخوان ‌ ‌ ه‌عنوان‌ سم ین‌آسمانه ای‌حالت‌پ سش‌ ا‌ .شوداین‌آسمانه

‌ رست‌آدره‌‌2545/1ی‌در‌آسمانه‌F1دمن‌ یشم ین‌دقرار‌ اشر‌که‌در‌د %24/75است‌که‌ ا ‌ ا

در‌دقایسه‌ ا‌حالت‌پ سش‌ ا‌تصوی ،‌.‌است%‌24/70و‌دیزان‌ف اخوان ‌‌%40/01این‌آسمانه‌دیزان‌دقت‌

F1کاهش‌یافمه‌است‌5/0افزایش‌و‌ف اخوان ‌ ه‌دیزان‌‌09/5و‌دقت‌ ه‌دیزان‌‌90/9 ه‌دیزان‌‌.

Page 154: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

095

ارائه زدینه این در کار اداده ای پیشنسادات خ ،ناده پایان این در آدره رست نمایج ه توجه ا

‌:شودد

هیای‌‌اسمفاده‌از‌این‌رو ‌ ای‌دمون‌چاپ ‌که‌ ا‌توجه‌ یه‌اینکیه‌دمیون‌چیاپ ‌از‌پیچییرگ ‌‌‌‌‌ (0

نوشمه‌ خوردارنر،‌این‌رو ‌ ‌روی‌آنسا‌نمیایج‌ سمی ی‌خواهیر‌‌‌‌کمم ی‌نسبت‌ ه‌دمون‌دست

.داشت

تنوع‌در‌تعراد‌و‌ها،‌‌گذاری‌ف اوان‌داننر‌س کششانهعلائم‌نساخمار‌ز ان‌فارس ‌ ه‌دلیل‌وجود‌ (4

‌پایین‌ح وف ‌ الا‌و ‌دوقعیت‌نقاط‌در ‌زی ، ‌جای‌ح وف‌و‌تشکیل‌شرن‌کلمات‌از کلمات‌ ه

‌انگلیس ‌د ‌‌ز انت ‌از‌کلمات‌ سیار‌پیچیره وجود‌فاصله‌ ین‌زی ه‌همین‌دلیل‌ایجاد‌ اشر،

‌نیز‌ددشخصه ‌نمایج‌ سم ی‌ر‌ای‌که‌ موانر‌این‌دوارد‌را ز ان‌فارس ‌خواهر‌‌روینظ ‌ گی د،

.داشت

دطی ح‌شیره‌در‌ایین‌پاییان‌‌‌‌‌رو ‌‌ ادر‌ خ ‌کلمات‌در‌فارس ‌ح وف‌تک اری‌وجود‌دارد‌که‌ (9

ای‌کیه‌تکی ار‌حی وف‌در‌‌‌‌،‌اسمفاده‌از‌دشخصهدوقعیت‌ی ‌تک ار‌از‌آن‌قا ل‌نمایش‌است‌ناده

ای‌کلمات‌فارس ‌است‌و‌نمایج‌ سمی ی‌‌‌ی‌ سم یی ‌کلمه‌را‌نیز‌در‌نظ ‌ گی د،‌تمیز‌دهنره

.خواهر‌داشت

توانر‌س عت‌جسمجو‌د ‌ی‌اسمخ اج‌ویژگ در‌د حله‌SIFTت ‌از‌های‌س یعاسمفاده‌از‌ویژگ (5

.الگوریمم‌را‌ سبود‌دهر

Page 155: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

097

‌م‌د اجع 7

مراجع

[1] T. Kameshiro, T. Hirano, Y. Okada, and F. Yoda, "A document image retrieval

method tolerating recognition and segmentation errors of OCR using shape-

feature and multiple candidates," in Document Analysis and Recognition, 1999.

ICDAR'99. Proceedings of the Fifth International Conference on, 1999, pp. 681-

684. [2] L. Li, S. Lu, and C. L. Tan, "A fast keyword-spotting technique," in Document

Analysis and Recognition, 2007. ICDAR 2007. Ninth International Conference

on, 2007, pp. 68-72. [3] G. Jones, J. Foote, K. Sparck Jones, and S. Young, "Video mail retrieval: The

effect of word spotting accuracy on precision," in Acoustics, Speech, and Signal

Processing, 1995. ICASSP-95. International Conference on, 1995, pp. 309-312.

[4] Y. Lu, L. Zhang, and C .L. Tan, "Retrieving imaged documents in digital

libraries based on word image coding," in Document Image Analysis for

Libraries, 2004. Proceedings. First International Workshop on, 2004, pp. 174-

187.

[5] V. Frinken, A. Fischer, R. Manmatha, and H. Bunke ", A novel word spotting

method based on recurrent neural networks," Pattern Analysis and Machine

Intelligence, IEEE Transactions on, vol. 34, pp. 211-224, 2012. [6] S. H. Kim, S. C. Park, C. B. Jeong, J. S. Kim, H. R. Park, and G. S. Lee,

"Keyword spotting on Korean document images by matching the keyword

image," in Digital libraries: implementing strategies and sharing experiences,

ed: Springer, 2005, pp. 158-166. [7] Y. Lu and C. L. Tan, "Chinese word searching in imaged documents,"

International Journal of Pattern Recognition and Artificial Intelligence, vol. 18,

pp. 229-246, 2004. [8] S. Belongie, G. Mori, and J. Malik, "Matching with shape contexts," in Statistics

and Analysis of Shapes, ed: Springer, 2006, pp. 81-105. [9] G. L. Scott and H. C. Longuet-Higgins, "An algorithm for associating the

features of two images," Proceedings of the Royal Society of London B:

Biological Sciences, vol. 244, pp. 21-26, 1991. [10] T. M. Rath and R. Manmatha, "Word spotting for historical documents,"

International Journal of Document Analysis and Recognition (IJDAR), vol. 9,

pp. 139-152, 2007. [11] T. Konidaris, B. Gatos, K. Ntzios, I. Pratikakis, S. Theodoridis, and S. J.

Perantonis, "Keyword-guided word spotting in historical printed documents

using synthetic data and user feedback," International Journal of Document

Analysis and Recognition (IJDAR), vol. 9, pp. 167-177, 2007. [12] S. N. Srihari, H. Srinivasan, C. Huang, and S. Shetty, "Spotting words in Latin,

Devanagari and Arabic scripts," VIVEK-BOMBAY, vol. 1, pp. 2-9, 2006. [13] B. Zhang, S. N. Srihari, and C. Huang, "Word image retrieval using binary

Page 156: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

090

features," in Electronic Imaging 2004, pp. 45-53. [14] Y. POURASAD, H. HASSIBI, and A. GHORBANI, "A Farsi/Arabic Word

Spotting Approach for Printed Document Images," International Journal of

Natural & Engineering Sciences, vol. 6, pp.15-18, 2012. [15] S. Lu and C. L. Tan, "Keyword spotting and retrieval of document images

captured by a digital camera," in Document Analysis and Recognition, 2007.

ICDAR 2007. Ninth International Conference on, 2007, pp. 994-998. [16] S. Bai, L. Li, and C. L. Tan, "Keyword spotting in document images through

word shape coding," in Document Analysis and Recognition, 2009. ICDAR'09.

10th International Conference on, 2009, pp. 331-335. [17] A. Kefali and C. Chemmam, "A Semi-Automatic Approach of old Arabic

Documents Indexing," in CIIA, 2011. [18] Y. Pourasad, H. Hassibi, and A. Ghorbani, "A word spotting method for Farsi

machine-printed document images," Turkish Journal of Electrical Engineering

& Computer Sciences, vol. 21, pp.1-13, 2013. [19] G. R. Ball, S. N. Srihari, and H. Srinivasan, "Segmentation-based and

segmentation-free methods for spotting handwritten arabic words," in Tenth

International Workshop on Frontiers in Handwriting Recognition ,2006. [20] S. Srihari, H. Srinivasan, P. Babu, and C. Bhole, "Handwritten arabic word

spotting using the cedarabic document analysis system," in Proc. Symposium on

Document Image Understanding Technology (SDIUT-05), 2005, pp. 123-132.

[21] G. Kim and V .Govindaraju, "A lexicon driven approach to handwritten word

recognition for real-time applications," Pattern Analysis and Machine

Intelligence, IEEE Transactions on, vol. 19, pp. 366-379, 1997.

[22] S. Marinai, "Text retrieval from early printed books , " International Journal on

Document Analysis and Recognition (IJDAR), vol. 14, pp. 117-129, 2011. [23] J. Almazán, A. Gordo, A. Fornés, and E. Valveny, "Segmentation-free word

spotting with exemplar svms," Pattern Recognition, vol. 47, pp. 3967-3978,

2014. [24] J. Sánchez, F. Perronnin, T. Mensink, and J. Verbeek, "Image classification with

the fisher vector: Theory and practice," International journal of computer vision,

vol. 105, pp. 222-245, 2013. [25] T. M. Rath and R. Manmatha, "Word image matching using dynamic time

warping," in Computer Vision and Pattern Recognition.Proceedings.IEEE

Computer Society Conference on, vol. 2, pp. II-521-II-527,2003. [26] T. Adamek, N. E. O’Connor, and A. F. Smeaton, "Word matching using single

closed contours for indexing handwritten historical documents," International

Journal of Document Analysis and Recognition (IJDAR), vol. 9, pp. 153-165,

2007. [27] J. A. Rodrıguez and F. Perronnin, "Local gradient histogram features for word

spotting in unconstrained handwritten documents," in Int. Conf. on Frontiers in

Handwriting Recognition, 2008. [28] A. Fischer, A. Keller, V. Frinken, and H. Bunke, "HMM-based word spotting in

handwritten documents using subword models," in Pattern recognition (icpr),

2010 20th international conference on, 2010, pp. 3416-3419. [29] J. Rodriguez-Serrano and F. Perronnin, "A model-based sequence similarity with

Page 157: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

092

application to handwritten word spotting," Pattern Analysis and Machine

Intelligence, IEEE Transactions on, vol. 34, pp. 2108-2120,2012. [30] A. Abidi, A. Jamil, I. Siddiqi, and K. Khurshid, "Word spotting based retrieval

of urdu handwritten documents," in Frontiers in Handwriting Recognition

(ICFHR), 2012 International Conference on, 2012, pp. 331-336.

[31] Y. Pourasad, H .Hassibi, and A. Ghorbani, "Farsi Word Spotting and Font Size

Recognition," Procedia Technology, vol. 1, pp. 372-377, 2012.

ای‌جسمجوی‌کلمات‌در‌کمیب‌تیاریخ ‌‌‌ی ‌رو ‌ت کیب ‌"م،‌.ج،‌رضوی.م،‌صرری.آ ادیعل ‌‌‌]94[

‌.549-500،‌ص‌0920،‌اولین‌کنف انس‌ ازشناس ‌الگو‌و‌تحلیل‌تصوی ‌ای ان،‌"نویس‌فارس ‌دست[33] R. Manmatha, C. Han, E. M. Riseman, and W. B. Croft, "Indexing handwriting

using word matching," in Proceedings of the first ACM international conference

on Digital libraries, 1996, pp. 151-159. [34] S. Kane, A. Lehman, and E. Partridge, "Indexing George Washington’s

handwritten manuscripts," Center for Intelligent Information Retrieval,

Computer Science Department, University of Massachusetts, Amherst, MA, vol.

1003, 2001. [35] Y. Lu, C. L. Tan, W. Huang, and L. Fan, "An approach to word image matching

based on weighted Hausdorff distance," in Document Analysis and Recognition,

2001. Proceedings. Sixth International Conference on, 2001, pp. 921-925.

[36] Z. S. Harris, "Distributional structure," vol. 10, pp. 146-162, 1954. [37] G. Csurka, C. Dance, L. Fan, J. Willamowski, and C. Bray, "Visual

categorization with bags of keypoints," in Workshop on statistical learning in

computer vision, ECCV, 2004, pp. 1-16. [38] F. Perronnin, "Universal and adapted vocabularies for generic visual

categorization," Pattern Analysis and Machine Intelligence, IEEE Transactions

on, vol. 30, pp. 1243-1256, 2008. [39] R. Shekhar and C. Jawahar, "Word image retrieval using bag of visual words," in

Document Analysis Systems (DAS), 2012 10th IAPR International Workshop on,

2012, pp. 297-301. [40] M. W. Sagheer, N. Nobile, C. L. He, and C. Y. Suen, "A novel handwritten urdu

word spotting based on connected components analysis," in Pattern Recognition

(ICPR), 2010 20th International Conference on, 2010, pp. 2013-2016. [41] S. Wshah, G. Kumar, and V. Govindaraju, "Script independent word spotting in

offline handwritten documents based on hidden markov models," in Frontiers in

Handwriting Recognition (ICFHR), 2012 International Conference on, 2012, pp.

14-19. [42] Z. Bahmani and R. Azmi, "Farsi/Arabic Document Image Retrieval through

Sub-Letter Shape Coding for mixed Farsi/Arabic and English text" IJCSI

International Journal of Computer Science Issues, Vol. 8, pp. 166-172,

September 2011 [43] R. Manmatha, C. Han ,and E. M. Riseman, "Word spotting: A new approach to

indexing handwriting," in Computer Vision and Pattern Recognition, 1996.

Proceedings CVPR'96, 1996 IEEE Computer Society Conference on, 1996, pp.

Page 158: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

051

631-637. [44] J. Almazán, A. Gordo, A. Fornés, and E. Valveny, "Word spotting and

recognition with embedded attributes," Pattern Analysis and Machine

Intelligence, IEEE Transactions on, vol. 36, pp. 2552-2566, 2014. [45] J. A. Rodriguez-Serrano, F. Perronnin, and F. Meylan, "Label embedding for

text recognition," in Proc. BMVC, 2013. [46] J. F. G. Srikantan and S. Srihari, "Handprinted character/digit recognition using

a multiple feature/resolution philosophy," in Proc. Fourth Int'l Workshop

Frontiers in Handwriting Recognition, 1994, pp. 57-66. [47] K. Mikolajczyk and C. Schmid, "Scale & affine invariant interest point

detectors," International journal of computer vision, vol. 60, pp. 63-86, 2004. [48] D. G. Lowe, "Object recognition from local scale-invariant features," in

Computer vision, 1999. The proceedings of the seventh IEEE international

conference on, 1999, pp. 1150-1157.

‌ LIDARهیای‌اسمخ اج‌عوارض‌دمنیاظ ‌در‌تصیوی ‌هیوای ‌و‌داده‌‌‌"ف،‌.زادگانع،‌صمر.عا رین ‌‌‌]52[

‌.07‌،0907،‌همایش‌ژئوداتی ‌"SIFT اساس‌الگوریمم‌[50] D. G. Lowe, "Distinctive image features from scale-invariant keypoints,"

International journal of computer vision, vol. 60, pp. 91-110, 2004. [51] M. Ziaratban, K. Faez, and F. Bagheri, "FHT: An unconstraint Farsi handwritten

text database," in Document Analysis and Recognition, 2009. ICDAR'09. 10th

International Conference on, 2009, pp. 281-285. [52] H. Angrish and S. Kaur, "A Survey on Feature Description Techniques,"

International Journal of Science and Research, vol. 4, pp. 38-41, 2015.

وهشیناده‌‌ژ،‌پ" ینی ‌ حی ان‌دیال ‌‌‌ رس ‌را طه‌ یین‌الگوهیای‌پییش‌‌‌"ز،‌‌.ه،‌پورزدان .نیکود ام ‌]59[

.54‌،0900-99،‌ص‌0،‌شماره0،‌دوره"حسا راری‌دال ‌و‌حسا س

[54] J. Almazan, A. Gordo, A. Fornés, and E. Valveny, "Handwritten word spotting

with corrected attributes," in Computer Vision (ICCV), 2013 IEEE International

Conference on, 2013, pp. 1017-1024.

]55 [‌ ‌احمری. ایسمه‌تاش ‌ ‌.ف دالف، ‌ی ‌ خط‌کلمات‌دست‌نوشمه ازشناس ‌ ون"ع، فارس ‌در

‌لغات ‌دحرود ‌"دجموعه ‌ارشر ‌کارشناس ‌ناده ‌پایان ، ‌ ‌شاه ود،‌-دسنرس ‌دانشگاه الکم ونی ،

.0921زدسمان‌[56] M. Ziaratban and K. Faez, "An adaptive script-independent block-based text line

extraction," in 2010 International Conference on Pattern Recognition, 2010, pp.

249-252. [57] Y. Li, Y. Zheng, D. Doermann, and S. Jaeger, "Script-independent text line

segmentation in freestyle handwritten documents," Pattern Analysis and

Machine Intelligence, IEEE Transactions on, vol. 30, pp. 1313-1329, 2008.

Page 159: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

050

Abstract

Word spotting is a way to search for text information in document images. This

process includes finding and locating a query word within a document image. In this

context, more researches are provided on Latin documents. A Few researches in Arabic

and Farsi has been reported, the majority of these researches are on printed documents.

In this thesis we present a Farsi handwritten word spotting system. The proposed system

is based on two steps. In the first stage, all existing connected components in the text

image have been extracted, then the first connected component of each line is

determined. Therefore by applying the nearest neighbor method, all the connected

components of each line obtained according to their order in the text. As a result, after

this stage, each of the connected components in the text devoted to one of the lines.

Actually each line can be demonstrated with its connected components independent of

other lines. The result of this stage is decomposing the text image into separated lines. In

the next step with regard to the rule that the majority of prepositions and Persian words

are combination of one to seven connected components, the words in the text are

extracted. Actually the connected components of an independent word in the text are

indentified in the same order of appearance in the word. For each of the word images

extracted, the coordinates of their location in the text is saved.

As a result, after the first stage a set of candidate words is obtained. In the second

stage, the goal is to find all instances of a query word in this set then their location in the

text is specified. The query word may be a text string or may also be an image. In this

stage, for word spotting we use attributes from Persian alphabet. The use of this kind of

attributes makes word spotting independent of the writing style.

This approach has been applied on a dataset consisting of 55 query words and 100

Farsi handwritten document images. Average precision and recall for query by image is

75.45% and 80.42% and for query by text is 80.28% and 78.92%.

Keywords: : Keyword spotting, Handwritten Farsi document images, Attributes,

Label Embedding, Separating lines of text, Connected Components

Page 160: ریوصت کی رد تاملک یوجتسج · .تساهرشدانمساهدافمسادرودعج ده گیدناققحدیاسشهوژپجیامنزاهدافمسارد ایکرردعونچیهتفایردیا

054

Shahrood University of Technologhy

Faculty of Electrical Engineering

Handwritten Farsi WordSpotting Using Attributes

embedding Technique

Bahare Asadi

Supervisor:

Dr. Alireza AhmadiFard

Adviser:

Majid Iranpour

February 2016