НИИ Искусственный...

95
НИИ Искусственный интеллект 1

Upload: others

Post on 06-Mar-2020

49 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

1

Page 2: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

2

Қазақстан Республикасының Білім және ғылым министлігі Шаруашылық жүргізу құқығы негізіндегі республикалық мемлекеттік кәсіпорны

«Л.Н.ГУМИЛЕВ АТАНДАҒЫ ЕУРАЗИЯ ҰЛТТЫҚ УНИВЕРСИТЕТІ» «ЖАСАНДЫ ИНТЕЛЛЕКТ» ҒЗИ

№ 16.21.37

ӘОК 811

Мемтіркеу № 0113РК00460

Инв.№

БЕКІТЕМІН:

Ғылыми-зерттеу жұмысы жөніндегі

проректор

______________ А.Талтенов

«____» ____________ 2015 г.

ҒЫЛЫМИ-ЗЕРТТЕУ ЖҰМЫС

ЕСЕБІ

ҚАЗАҚША ЖАЗУДЫ ЛАТИНИЦАҒА АУДАРУДЫҢ ҒЫЛЫМИ, ӘДІСНАМАЛЫҚ,

ТЕХНОЛОГИЯЛЫҚ ЖӘНЕ ӘДІСТЕМЕЛІК НЕГІЗДЕРІ

тақырыбы бойынша

(қорытынды)

Тақырып жетекшілері ______________ А.Ә. Шәріпбай

______________ Д.Қамзабекұлы

Астана 2015

Page 3: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

3

ОРЫНДАУШЫЛАР ТІЗІМІ

ҒЗЖ жетекші, т.ғ.д., профессор

Шәріпбай А.А. (кіріспе, 1-4 бөлімдер, корытынды)

ҒЗЖ жетекші, т.ғ.д., профессор

Камзабекулы Д. (кіріспе, 1-2 бөлімдер, корытынды)

Орындаушы: Жетекші ғыл.қызметкер, т.ғ.к.

Омарбекова А.С. 3,4 бөлімдер

Page 4: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

4

РЕФЕРАТ Есеп 80 бет, 3 бөлім, 2 сурет, 6 кесте., 22 әдебиет, 14 қосымша.

АЛГОРИТМ, АНАЛИЗАТОР, ӘЛІПБИ, ӘРІП, ГРАММАТИКА, ДЫБЫС,

ДАУЫСТЫ, ДАУЫССЫЗ, КИРИЛЛИЦА, КОНВЕРТЕР, ЛАТИНИЦА,

МАТЕМАТИКАЛЫҚ МОДЕЛЬ, МОРФОЛОГИЯ, ОРФОГРАФИЯ, ОРФОЭПИЯ,

ПОРТАЛ, СИНТАКСИС, ФОНЕМА, ФОНЕТИКА,

Зерттеу объектісі: қазақ және басқа түркі тілдерінің әліпбиі, жазуы және дыбыстық

жүйесі; қазақ тілінің сөздері және сөз тіркестері, орфографиясы; орфоэпиясы, қазақ

тілінің морфологиялық және синтаксистік ережелері.

Жоба мақсаты: қазақша жазуды латиницаға аударудың тиімді әдісін табу және

пайдалану, оның технологиялық және әдістемелік негіздерін анықтау.

Зерттеу нәтижесінде келесілер жасалды: басқа түркі тілдері жазуларын латиницаға

көшірудің нәтижелерінің талданымы, қазақ тілінде қолданыстағы әлібиде жарияланған

оқулықтар мен оқу құралдарындағы қайшылықтардың талданымы, қазақ тілінің

дыбыстық жүйесінің талданымы, қазақ тілінің қазақ дыбыстарын латын әріптерімен

таңбалау әдістері анықталды, қазақ тілінің латын әліпбиі жобасы және қазақ дыбыстарын

таңбалаудың орфографиялық ережелері дайындалды, кірме кирилл әріптерінің дыбыстық

талданымы, қазақ тіліне кірме терминдерді латын графикасымен таңбалаудың өтпелі

ережелері анықталды, латын графикасында қазақ тілінің орфографиялық сөздігі құрылды,

қазақша мәтіндерді кириллицадан латиницаға аударатын алгоритмі құрылды және оны

программалық жүзеге асыру арқылы конвертер әзірленді, қазақ тілінің латиницадағы

орфографиялық емлелері анықталды, қазақ тілінің морфологиялық және синтаксистік

ережелерінің онтологиясы тұрғызылды, қазақ тілінің латиницадағы морфологиялық және

синтаксистік анализаторлары программалық жүзеге асырылды, көпсалалы қазақ

терминдерінің латиницадағы электрондық сөздігі, қазақ тілі бойынша латницада

көпдеңгейлі электрондық оқу басылымы әзірленді, қазақ тілінің латиницада веб-порталы

даярланды.

Алынған нәтижелер қазақ тілінің дыбыстық жүйесін анықтауда және жаңа қазақ

әліпбиін дұрыс құруда, қазақ тілінің орфографиялық емлелері және морфологиялық,

синтаксистік ережелерін айқындағанда қолданыла алады. Қазақша сөйлеуді автоматты

тану, синтездеу жүйелерін жүзеге асыру кезінде дыбыстарды фонетикалық және

фонологиялық талдаудың рөлі ерекше. Сонымен қатар, алынған нәтижелер қазақ тіліндегі

мәтіндерді электронды құралдарда теру, жинақтау, сақтау, өңдеу, тасымалдау және басып

шығару үшін қажет қазақ әріптерінің цифрлық кодтарының стандартын жасағанда

пайдаланылады.

Page 5: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

5

Ғылыми нәтижелердің қолдануы.

Алынған нәтижелер қазақ тілінің дыбыстық жүйесін анықтауда және жаңа қазақ

әліпбиін дұрыс құруда, қазақ тілінің орфографиялық емлелері және морфологиялық,

синтаксистік ережелерін айқындағанда қолданыла алады. Қазақша сөйлеуді автоматты

тану, синтездеу жүйелерін жүзеге асыру кезінде дыбыстарды фонетикалық және

фонологиялық талдаудың рөлі ерекше. Сонымен қатар қазақ тіліндегі мәтіндерді

электронды құралдарда теру, жинақтау, сақтау, өңдеу, тасымалдау және басып шығару

үшін қажет қазақ әріптерінің цифрлық кодтарының стандартын жасағанда көмегі болады.

Ғылыми жұмыстардың нәтижелері қазақ тілінің латиницада көпсалалы қазақша-

орысша терминологиялық сөздігін, қазақ тілі бойынша латиницада электрондық оқу

басылымын даярлауда және қазақ тілінде әдеби кітаптардың мәтіндерін латинацаға аудару

үшін қолданылды, олар қазақ тілінің веб-порталында орналасқан (http://alphabet.kz/).

2013-2015 жж. ҒЗЖ бойынша 51 ғылыми жұмыстар жарияланды (Қосымша А):

- 1 – мақала Thomson Reuters базасында индекстелетін журналда;

- 7 мақала Scopus базасында индекстелетін журналда;

- 3 мақала ҚР БҒМөң БҒСБК ұсынған ғылыми журналда; - 8 жариялым алыс шетелдегі халықаралық ғылыми конференциялар еңбектерінде;

- 3 жариялым жақын шетелдегі халықаралық ғылыми конференциялар еңбектерінде;

- 29 жариялым республикалық халықаралық ғылыми конференциялар еңбектерінде.

Осы ҒЗЖ аясында ғылыми-педагогикалық кадрлар дайындалуда:

1) Ж.Есенбаев «Шуылдар жағдайындағы белгілі сөздік негізінде қазақ сөйлеулерін

тану», 6D060200 – Информатика мамандығы бойынша PhD диссертация, 2014 ж.

2) А. Бөрібаева «Дифондар моделі негізінде қазақ сөздерін тану», 6D060200 –

Информатика мамандығы бойынша PhD диссертация 2015 ж.

3) А. Муқанова «Қазақ тіліндегі білімдерді семантикалық өңдеу модельдері мен

әдістері» , 6D060200 – Информатика мамандығы бойынша PhD диссертация 2015 ж.

4) Б. Кәрімжан «Қазақ тілі» , 6D060200 – Информатика мамандығы бойынша PhD

диссертация даярлануда, қорғау 2016 жылға жоспарланған.

5) У. Бегімтай «Қазақ тілінің интеллектуалды электрондық оқу басылымын жасау» ,

6D060200 – Информатика мамандығы бойынша PhD диссертация даярлануда, қорғау 2016

жылға жоспарланған.

ҒЗЖ тақырыбына байланысты 2013 жылы 8 магистерлік диссертация, 2014 жылы 1

PhD диссертация, 8 магистерлік диссертация, 2015 жылы 3 PhD диссертация, 4

магистерлік диссертация қорғалды.

Page 6: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

6

МАЗМҰНЫ

Беті

АНЫҚТАМАЛАР, БЕЛГІЛЕУЛЕР ЖӘНЕ ҚЫСҚАРТУЛАР 7

1 ЛАТИНИЦАДАҒЫ ҚАЗАҚ СӨЙЛЕМДЕРІН ТАЛДАУ ЖӘНЕ ТУДЫРУ ПРОГРАММАЛАРЫ 17

1.1. Латиницадағы қазақ тілінің сөйлемдерін талдау программалары 17 1.1.1. Латиницадағы қазақ тілінің жәй сөйлемдерін талдау программасы 17 1.1.2. Латиницадағы қазақ тілінің құрмалас сөйлемдерін талдау программасы 25

1.2. Латиницадағы қазақ тілінің сөйлемдерін тудыру программалары 27 1.2.1. Латиницадағы қазақ тілінің жәй сөйлемдерін тудыру программасы 27 1.2.2. Латиницадағы қазақ тілінің құрмалас сөйлемдерін тудыру программасы 37

2 ЛАТИНИЦАДАҒЫ КӨПСАЛАЛЫ ҚАЗАҚ ТЕРМИНДЕРІНІҢ ДЕРЕКТЕР БАЗАСЫ 38

3 ЛАТИНИЦАДАҒЫ ҚАЗАҚ ТІЛІ БОЙЫНША КӨПДЕҢГЕЙЛІ ЭЛЕКТРОНДЫҚ ОҚУ БАСЫЛЫМЫН ДАЙЫНДАУ. 38

ҚОРЫТЫНДЫ 58

ҚОЛДАНЫЛҒАН ӘДЕБИЕТТЕР 63

ҚОСЫМША А 65

ҚОСЫМША Б 70

ҒЗЖ-НЫҢ 2014 ЖЫЛҒЫ КҮНТІЗБЕЛІК ЖОСПАРЫ 94

Page 7: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

7

АНЫҚТАМАЛАР, БЕЛГІЛЕУЛЕР ЖӘНЕ ҚЫСҚАРТУЛАР

АЛГОРИТМ (Әл-Хорезмидің атынан шыққан) — ақырлы қадам жасау арқылы

белгiлi бiр топтағы кез келген есептi шешуге арналған түсiнiктi және дәл қай амалды

қаңдай ретпен орындау керек туралы нұсқаулардың ақырлы тiзбегiн айтамыз.

АНЫҚТАУЫШ - сөйлемде негізінде зат есімненболған мүшені сын, сапа, сан,

мөлшер және меншіктік жағынан сипаттайтын тұрлаусыз мүше.

ӘЛІПБИ – жазуда қолданылатын әріптердің белгіленген тәртіп бойынша орналасқан

жиынтығы.

ӘРІП—дыбыстың графикалық таңбасы.

БАСТАУЫШ - сөйлемде атау септік тұлғасында тұрып, ойдың иесі

болатын тұрлаулы сөйлем мүшесі.

БАЯНДАУЫШ - сөйлемде бастауыштың қимылын, ісін, жай-күйін, кім, не екенін

білдіріп тұратынтұрлаулы сөйлем мүшесі.

БІЛІМДЕР БАЗАСЫ – білімдерге амалдар жасау үшін арналған деректер базасы.

ГИПЕРГРАФ – әрбір қабырғасымен тек қана екі емес, одан да басқа төбелер

жиынтығымен байланысатын графтың жалпыланған түрі.

ДАУЫССЫЗ ДЫБЫСТАР – ауа ағыны толықтай немесе жарым-жартылай

оқшауланатындай және кедергіден өтіп өзінің бағытын өзгертетіндей дауыс жолы

тарылып айтылатын дыбыстар типі.

ДАУЫСТЫ ДЫБЫСТАР – артикуляция кезінде ауа ағынына айтарлықтай кедергі

келмейтін дыбыстар типі. Дауысты дыбыстар артикуляциясы барлық спектрде периодтық

тербеліс сияқты көрсетіледі. Дауысты дыбыстардың артикуляциясындағы ерекшеліктер

резонатор (тіл, еріннің орны) формасының өзгеруімен жетеді.

ДЫБЫС – адамның артикуляциялық әрекетінің нәтижесі болып табылатын

сөйлеудің бөлінбейтін ең кіші бірлігі.

ЕТІСТІК– заттың қимылын, іс-әрекеті мен амалын білдіретін сөз табы

ЖАЗУ – деректерді формалдау, бекіту және жіберу үшін арналған белгілік жүйе.

ЖАЛҒАУ–сөз бен сөзді байланыстыратын, сөз аралығындағы қатынастардың

көрсеткіші болып табылатын, сөзге грамматикалық мағына үстейтін қосымшалар.

ЗАТ ЕСІМ – заттың, құбылыстың атын білдіріп, кім? не? деген сұраққа жауап

беретін сөз табы.

КОНВЕРТАЦИЯ – мәтінді бір әліпбиден екінші әліпбиге түрлендіру, аудару.

КОНВЕРТЕР – мәтінді бір әліпбиден екінші әліпбиге түрлендіру, аудару жүйесі.

МАТЕМАТИКАЛЫҚ МОДЕЛЬ – нақтылықтың математикалық тілдегі көрінісі.

Page 8: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

8

МОРФОЛОГИЯ – дербес сөздердің грамматикалық мағыналарын тексеретін,

грамматикалық сөз тұлғалардың қызметі мен қалыптасу, даму заңдылықтарын зерттейтін

тіл ғылымының бір сапасы.

МОРФОЛОГИЯЛЫҚ СИНТЕЗ – қалыпты форма және параметрлер жиынтығы

арқылы жаңа сөз формасын алу.

МОРФОЛОГИЯЛЫҚ ТАЛДАУ – сөз формасынан қалыпты форманы және осы сөз

формасына қатысты параметрлер жиынтығын анықтау.

ОНТОЛОГИЯ – даналардан (индивидтерден), түсініктерден (сыныптардан),

атрибуттардан (қасиеттерден), функциялардан (амалдардан), аксиомалардан

(фактылардан) және қатынастардан тұратын қайсыбір пәндік облыстың концептуалды

сұлба арқылы кең ауқымды және тәптіштеп формалдалданған көрінісі.

ОРФОГРАФИЯ — жазуда сөздің дұрыс жазылуын зерттейтін лингвистиканың

бөлімі.

ОРФОЭПИЯ – дыбыстық рәсімдеудің біркелкілігін қамтамасыз ететін ұлттық тілдің

айтылу нормаларының жинағы.

ПЫСЫҚТАУЫШ – сөйлемде іс-әрекеттің жай-күйін, сын-сипатын, мөлшерін,

мезгіл-мекенін, себеп-мақсатын білдіретін тұрлаусыз мүшесі.

САН ЕСІМ – заттың санын, мөлшерін, ретін, шамасын білдіретін сөз табы.

СИНТАКСИС –сөз тіркесі туралы, сөйлем туралы ғылым.

СИНТАКСИСТІК ТАЛДАУ – оқу және ғылыми мақсатында сөйлемді, оның

мүшелерін, түрлерін, құрмалас сөйлемнің құрамындағы жай сейлемдерді анықтау.

СӨЗ ТҮБІРІ – сол сөздің лексикалық мағынасын беретін және қосымшаның алдында

болатын сөз бөлігі.

СӨЗ ТҮРЛЕНУІ – сол лексеманың сөз формасының жасалуы, олардың

грамматикалық мағыналары әртүрлі болады.

СӨЗ ТІРКЕСІ –толық мағыналы екі я бірнеше сөздің бір-біріне тұлғалық әрі

мағыналық жағынан бағына байланысуы.

СӨЗЖАСАМ – бүр түбірлі сөздерден жаңа сөздердің туындауы.

СЫН ЕСІМ – заттың сапасын, сипатын, қасиетін, көлемін, салмағын, түсін (түр-

реңін) және басқа сол сияқты сыр-сипаттарын білдіретін лексика-грамматикалық сөз табы

ТОЛЫҚТАУЫШ – сөйлемде негізінде атау мен іліктен басқа септіктің бірінде

тұрып, бір мүшені заттық мағына жағынан толықтыратын тұрлаусыз мүше.

ФОНЕТИКА – сөйлеудің дыбыстарының жасалу тәсілін және олардың акустикалық

сипаттамасын зерттейтін тіл білімінің бөлімі.

ФОРМАЛДАУ – формалданған теорияда мазмұнды білімді бейнелеу.

Page 9: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

9

КІРІСПЕ

Ғылми-зерттеу жұмысының (ҒЗЖ-ның) көкейкестілігі.

Қазақстан Республикасының Президенті Н. Назарбаев 14.12.2012 жылы өзінің

Халыққа жолдауында Үкіметке қазақ әліпбиінің 2025 жылы латын әліпбиіне көшуге

дайындық жүргізуді бастауға тапсырма берді. Елбасы «Ол қазақ тілінің дамуына қызмет

етіп қана қоймай, оны заманауи ақпараттық тілге айналдырады. Балаларымыздың

болашағы үшін осындай шешім қабылдауға тиіспіз және бұл әлеммен бірлесе түсуімізге,

олардың ағылшын тілі мен интернет тілін жетік игеруіне, ең бастысы – қазақ тілін

жаңғыртуға жағдай туғызады» деп айтты [1]. Бұл қазір көптеген елдерде талқыланып

жүрген ғаламдану дәуірінде ғаламдық ақпараттық кеңістіктің бір ғана ортақ әліпбиі

болғанын қалап, ақпараттық ресурстарды ағылшын тілі қолданатын классикалық латын

әліпбиінде жасау мәселесін шешуге тікелей байланысты. Себебі, дүние жүзінде

шығарылып жатқан барлық электрондық құралдар (компьютерлер, телефондар және т.б.)

ағылшын тілі қолданатын классикалық латын әліпбиін қамтиды. Егер одан басқа тілдің ең

болмаса бір ғана әріпі классикалық латын әріпінен бөлек болса, онда осы тілдің әліпбиін

осы аппараттарда жұмыс істету үшін қосымша ұлттық қаріптер (шрифтер) мен

программа-драйверлерден басқа әртүрлі деректерді сұрыптау, іздеу және тану

программаларын талап етеді. Ал оларды жасау әжептәуір уақытты, еңбекті және

қаражатты талап етеді. Қазіргі кезеңде кез келген табиғи тілдің ақпараттық технологиясыз

дамуы мүмкін емес. Ағылшын, орыс, жапон, қытай және басқа тілдер үшін

мультимедиалық сөздіктер мен оқытуға, машиналық аударуға, сөйлеуді тану мен

тудыруға, мәтіндерді құруға арналған программалар; мәтіндердің мағыналарының

интерпретациялары және тағы басқалары бар. Қазақ тілінің де осылай дамуына болады.

Бірақ көптеген программалау тілдерінің орыс әліпбиіне енбеген қазақша ә, ө, ғ, қ, ң, ұ, ү, і,

һ әріптерін қабылдамауына байланысты қазақ тілінің компьютерлік өңделуі үшін қажетті

программалар құруға қиындықтар туғызады.

Осы айтылғандар «Қазақша жазуды латиницаға аударудың ғылыми, әдіснамалық,

технологиялық және әдістемелік негіздері» атты ҒЗЖ тақырыбының көкейкестігін

көрсетеді.

Тақырыпты жасау негізі, алғашқы деректері және ҒЗЖ-н жүргізу негіздемесі:

Қазақ тілі жазуының түп тамыры V ғ. б.з.б пайда болған көне түркі жазулары

екендігі белгілі. Ол VIII ғасырдан бастап ислам дінімен бірге енген араб әліпбиін

қолданды. Ал 1912 жылы Ахмет Байтұрсынұлы қазақ тілінің дыбыстық жүйесін

Page 10: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

10

айқындап, құрамында 28 әрпі бар араб графикасы негізінде жаңа әліпби жасап, төте жазу

ережесін анықтады. Кейін қазақ жазуы 1929 жылы 29 әрпі бар латын графикасы

негізіндегі әліпбиге, ал 1940 жылы орыс тілінің дыбыстары үшін қосымша 13 әріп

кіргізілген 42 әріптік кирилл графикасы негізіндегі әліпбиге ауыстырылды.

Соңғы реформа қазақ тілінің ерекшеліктері ескерілмей жүргізілді, ол қазақ

мәтінінде ендірілген орыс сөздерін жазу мен оқуды орыс тілінің нормасына сәйкес

орындауды талап етті. Нәтижесінде қазақ тілінің айтылым (орфоэпиясы) және жазылым

(орфографиясы) емлелерінде көптеген шытырмауық жиналып, ана тіліміздің табиғи

заңдылықтары бұзылды. Мысалы, қазіргі кездегі жазуда «и» және «у» дыбыстарына

аяқталатын «би», «ми», «бу», «су» сияқты сөздердің тәуелдік жалғауларының үшінші

жағында «би+i», «ми+ы», «бу+ы», «су+ы» болады. Бұлар “Қазақ тілінде тәуелдік

жалғауларының үшінші жағында дауыссыздармен аяқталатын сөздерге «i» немесе «ы»

жалғауы жалғанады, ал дауыстыларға аяқталатын сөздерге «сі» немесе «сы» жалғауы

жалғанады” деген ережеге қайшы болады. Егер қазақ тілінде «и» және «у» дыбыстарын

дауыссыздар деп есептесек, онда «би», «ми», «бу», «су», «ту» деген сөздерде бір де буын

болмайды екен. Оларды «бій», «мый», «бұу», «сұу», «тұу» деп дұрыс жазу керек. Қазақ

тілінің бұл жағдайы оны мемлекеттік тіл ретінде дамыту түгіл, тура күйретіп барады. Осы

күнге дейін қазақ тіліне қатысты бір-біріне қарама-қайшы оқулықтар мен ғылыми

еңбектер шығуда (Қосымша Б). Демек, қазақ тіліне жаңа реформа керектігінде күмән жоқ.

Егер оны қазір жасамасақ, онда қазақ тілі уақыт өткен сайын өзінің табиғи заңдылығынан

айырылып қандай-да бір бұдандық тілге айланып кетуі мүмкін.

Әлемде шығып жатқан барлық компьютерлер мен телекоммуникациялық

құралдардың ағылшын тілінің әліпбиін қолданатындығы және болашақта да

қолданатындығы белгілі. Басқа әліпбилерді енгізу және қолдану үшін аз емес қаржы

жабдығы мен зияткерлік күшті қажет ететін арнайы кодировкалар мен драйверлер болуы

керек. Күнделікті өмірге әртүрлі мүмкіндіктегі компьютерлер мен телекоммуникациялық

құралдардың жалпы енуіне байланысты бұл есептер қиын шешілетін болуда.

Мемлекеттік тіл статусы жасалып жатқан электрондық ақпараттық ресурстардың

(сөздіктер, оқулықтар және басқа білім беретін программалар, деректер мен білімдер

базасы, ақпараттық іздеу және анықтамалық жүйелер, сараптамалық жүйелер және

басқалары) қазақ тілінде болуын талап етеді. Ақпараттық ресурстарды жасау көп ҒЗЖ-тар

жүргізуді талап ететін, қымбат тұратын үрдіс екені белгілі. Ол үшін ағылшын тілі

қолданатын классикалық латын әліпбиінде заманауи ақпараттық технологиялар көмегімен

жүзеге асыру тімді болады.

Page 11: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

11

Интернет арқылы іздеуіміздің нәтижесі бойынша біздің «Қазақша жазуды

латиницаға аударудың ғылыми, әдіснамалық, технологиялық және әдістемелік негіздері»

атты жоба жалғыз және әлемде оған ұқсас кешенді ҒЗЖ жоқ. Бірақ қазақ тілінің латынша

әліпби жобасын жасаған жеке авторлар бар: Ж.Ағабекова, С.Байбеков, З.Базарбаева,

Ә.Жүнісбек, Д.Ысқақұлы, М.Өтелбаев, А.Фазылжанова, Ш.Ыбраев және т.б. [2].

Әліпбилі тілдерде, солардың ішіне қазақ тілінде, әріптердің (фонемаларды

белгілейтін ең кіші жазу бірліктерінің) кез-келген тізбегі сөз бола алмайтындығы сияқты,

кез-келген сөздердің тізбегі сөз тіркесі немесе сөйлем құрамайтындығын және мүмкін

болатын сөздер мен сөйлемдерді шектейтін қандай да бір ережелер грамматикалық

(морфологиялық, синтаксистік) жиынтығы бар болатындығын ескеру қажет. Оларда

мүмкін болатын сөздер мен сөйлемдерді сипаттайтын грамматикалық ережелер

жиынтығы морфологиялық және синтаксистік деңгейлердің мәндерін құрайды. Осындай

тілдің морфологиялық және синтаксистік ережелер жиынтықтары сөздердегі әрбір

морфеманың және сөйлемдердегі әрбір сөздің қызметін анықтап, оның морфологиялық

және синтаксистік құрылымын сәйкес сипаттайды. Бұл қазақ әліпбиін кириллицадан

латиницаға ауыстыру барысында морфологиялық және синтаксистік ережелерін анықтап,

формалдау қажеттілігін тудырды. Оның негізінде латиницадағы қазақ тілінің жазбаша

сөздерін және сөз тіркестерін талдау және құрудың алгоритмдерін құрастыру керек

болды.

Ақпараттық технологиялардың дамыған заманында осы жоба аясында жасалған

әліпбиге негізделген бңрнеше программалық қосымшаларды (қазақша мәтіндерін

кириллицадан латиницаға автоматты аударатын конвертер, қазақ тілінің латиницадағы

морфологиялық және синтаксистік анализаторлары, көпсалалы қазақ терминдерінің

латиницадағы электрондық сөздігі, қазақ тілі бойынша латницада көпдеңгейлі

электрондық оқу басылымы әзірленді, қазақ тілінің латиницада веб-порталы) жасау

қажеттілі туды.

ҒЗЖ-ң зерттеу кезеңдерінің мақсаттары.

ҒЗЖ-ның жплпы мақсаты 2013-2015 жж мақсаттарынан тұрады:

ҒЗЖ-ның 2013 жылғы мақсаты қазақ тілінің кириллицадағы әртүрлі сала

(публистика, ресми іскерлік, ғылыми, ауызекі) бойынша мәтіндік корпусындағы әріптер

жиілігі негізінде қазақша жазуды латиницаға аударудың оңтайлы әдісін табу мен қолдану,

оның тиімді жүзеге асуының технологиялық және әдістемелік негіздерін анықтау;

ҒЗЖ-ның 2014 жылғы мақсаты қазақша жазуды латиницаға аударуды

программалық жүзеге асыру, латиницадағы қазақ тілінің морфологиялық және

Page 12: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

12

синтаксистік ережелерін анықтау және формалдау, латиницадағы жазбаша қазақша

сөздерді және сөз тіркестерін талдау мен құру алгоритмдерін әзірлеудің технологиялық

және әдістемелік негіздерін анықтау;

ҒЗЖ-ның 2015 жылғы мақсаты қазақ жазуларының латынша жазбаларының

электрондық базасын жасау.

ҒЗЖ-н орындаудағы кезеңдерінің міндеттерінің орны.

ҒЗЖ-ң 2013 жылғы міндеттері орындалып жатқан жобаның алғашқы деңгейі болып

табылады. Осы кезеңде жасалған жұмыстар нәтижелері қазақ әліпбиінің латын

графикасына көшірудің қағидалары, жаңа қазақ тілінің латын әліпбиі, анықталған қазақ

тілінің латиницадағы орфографиялық нормалары, қазақ орфографиясын құру ережелері

жобаның келесі жылға жоспарланған теориялық және практикалық кезеңдері –

кириллицадан латиницаға ауыстыру программасын жасау сияқты кезеңдерге өтуге

мүмкіндік береді.

ҒЗЖ-ң 2014 жылғы міндеттері орындалып жатқан жобаның екінші аралық деңгейі

болып табылады. Бұл кезеңде 2013 жылы атқарылған міндеттер көмегімен кириллицадан

латиницаға ауыстыру программасын жасау және қазақ тілінің морфологиялық және

синтаксистік ережелерін латиницада формалдау жобаның келесі жылға жоспарланған

практикалық кезеңдеріне көшуге мүмкіндік береді.

ҒЗЖ-ң 2015 жылғы міндеттері орындалып жатқан жобаның қорытынды практикалық

деңгейі болып табылады. Бұл кезеңде 2014 жылы атқарылған міндеттер негізінде қазақ

тілінің латиницадағы жазбаша жай және құрмалас сөйлемдерін талдау мен құру

алгоритмдері әзірленді және олар программалық жүзеге асыру, қазақ терминдерінің

латиницадағы көпсалалы электрондық сөздігін құру, қазақ тілі бойынша латницада

көпдеңгейлі электрондық оқу басылымын жасау және қазақ тілінің латиницада веб-

порталын жасау жоспарланды.

Жалпы жоба нәтижелері қазақ тілінің жазуын әртүрлі компьютерлер мен байланыс

құралдарында тиімді теру, жинақтау, сақтау, өңдеу, тасымалдау және басу үшін

қолданылады.

ҒЗЖ-н жүргізуде таңдалған жалпы әдістемелердің сипаттамасы.

Жобадағы ҒЗЖ пәнаралық (лингвистика мен информатика арасында) болады.

Анығына келсек, лингвистикаға мына зерттеулер жатады:

Қазақ тілінің және басқа түркі тілдерінің фонетикалық жүйлерін талдау.

Басқа түркі тілдерінің латын әліпбиіне көшу тәжірибесін талдау.

Page 13: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

13

Қазақ тілінің дыбыстық жүйесін және фонетикалық ережелерін талдау және

жіктеу.

Қазақ орфографиясын құру ережелерін жасау.

Қазақ тілінің және басқа түркі тілдерінің морфологиясын және синтаксисін

талдау.

Қазақ тілінің морфологиялық және синтаксистік ережелерін талдау және жіктеу.

Қазіргі қазақ орфографиясына сүйене отырып, кириллицада кірме дыбыстарсыз

орфографиялық ережелер жасаап, өтпелі қазақ орфографиясының сөздігін құрастыру.

Ал информатикаға келесі зерттеулер жатады:

Қазақ дыбыстарын компьютер арқылы формантты талдап, олардың

осцилограммасын автоматты тұрғызу;

Қазақ мәтіндерін кириллицадан латиницаға аудару алгоритмі құру және оны

программалық жүзеге асыру арқылы жасалынған конвертерді Интернетте жариялау;

Қазақ тілінің латиницадағы морфологиялық және синтаксистік ережелерінің

онтологиялық және математикалық моделдерін құру;

Қазақ тілінің латиницадағы морфологиялық және синтаксистік анализаторларын

жасап, Интернетте жариялау;

Көпсалалы қазақ терминдерінің латиницадағы электрондық сөздігін жасап,

Интернетте жариялау;

Қазақ тілі бойынша латницада көпдеңгейлі электрондық оқу басылымы әзірлеп,

Интернетте жариялау;

Қазақ тілінің латиницада веб-порталы жасап, Интернетте жариялау.

Сондықтан жобада лингвистикалық және информатикалық әдістер кеңінен

қолданылады, сонымен қатар толымсыздықты, қателерді және қайшылықтарды анықтау

әдістері де қолданылады. Айта кетсек, басқа түркі тілдердің жазуларының латиницаға

өтулерін талдау мен салыстыру әдістері және де олардың тиімділік бағалары

қолданылады.

Қорытындысында қазақ жазуларын мәтіндік корпустағы әріптердің және олардың

әртүрлі тіркестерінің кездесу жиіліктерін компьютер арқылы зерттеу арқылы ағылшын

тілі қолданатын классикалық латын әліпбиіне ауыстыру ұсынылады.

Патенттік зерттеулер туралы мағлұмат.

Орындалып жатқан ҒЗЖ аясында патенттік зерттеулер жүргізілмейді, себебі жоба

бойынша алынған ғылыми нәтижелер патенттік құқық объектісіне жатпайды.

Page 14: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

14

ҒЗЖ метрологиялық қамтамасы туралы мағлұмат.

ҒЗЖ метрологиялық қамтаманы талап етпейді, себебі жоба аясында өлшеу

жұмыстары қарастырылмаған.

ҒЗЖ-ның басқа зерттеулермен байланысы.

Бұл жұмыс «Іргелі және қолданбалы зерттеулер», «Елдің зияткерлік потенциалы»,

«Экономикалық, әлеуметтік және гуманитарлық ғылымдар облысындағы іргелі және

қолданбалы зерттеулер» бағдарламасы бойынша «Қазақ тілінің акустикалық корпусын

жасау және оның фонетикалық құрылымды анықтау, қазақ фонемаларын халықаралық

фонетикалық әліпбиінде бейнелеу» атты 2012-2014 жылдары жасалынып ҒЗЖ-мен

байланысты. Онда қазақ тілінің фонетикалық құрылымы (фонема саны, фонемалар тізімі,

фонемдердің жан-жақты артикуляциялық айырмашылығы) анықталады. Ол үшін

акустикалық әдіс қолданылады, онда қандай-да бір фонологиялық үдерістерге сәйкес

акустикалық заңдылықтарды табу мақсатында уақыттық және жиілік облысындағы сөйлеу

сигналы қазақ тілі фонемаларын халықаралық фонетикалық әліпбиіне сәйкес

транскриптеу үшін зерттеледі. . Ал бұл ҒЗЖ-нда қазақ дыбыстарын классикалық латын

әріптерімен белгілеу үшін қазақ тілінің дыбыстық жүйесі дыбыстардың жасалым, естілім

және қолданым тұрғысынан айқындалып, ұсынылған әліпби жобасының негізінде осы

кезеңде кириллицадан латиницаға аудару жүзеге асырылды.

Сонымен қатар бұл жұмыс 055 «Ғылыми және/немесе ғылыми- техникалық қызмет»,

ішкі бағдарлама 101 «Ғылыми зерттеулерді гранттық қаржыландыру» бюджеттік

бағдарламасы, Ақпараттық және телекоммуникациялық технологиялар приоритеті

бойынша орындалып жатқан «Қазақ тілінің жазбаша және ауызша сөйлеулерін тану және

тудыруды автоматтандыру» атты 2012-2014 жылдары орындалған ҒЗЖ-мен байланысты.

Осы ҒЗЖ-нда орындалған жұмыстарға сүйеніп латиницадағы қазақ тілінің

морфологиялық және синтаксистік ережелері анықталды, онтологиялық және

математикалық моделдері жасалынып формалданды. Оларды талдайтын алгоритмдер

құрылып, программалық жүзеге асырылды.

Жоспарланған ҒЗЖ-тың ғылыми-техникалық деңгейі жоғарылығы мынада:

Классикалық латын әліпбиін әртүрлі тілдерге бейімдеу әдістері талқыланып,

олардың қазақ тіліне қолдану мүмкіндігі көрсетілді.

Басқа түркі тілдерінің жазуларының латиницаға көшулерінің нәтижелері

талқыланып, олардың кемшіліктері көрсетілді.

Page 15: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

15

Қазақ тілі жазуының қазіргі проблемалары талқыланып, қазақ тіліне реформа

жасау қажеттігі негізделді.

Қазақ тілінің дыбыстық жүйесі зерттеліп, қазақ дыбыстарының саны мен түрлері

айқындалды, дауысты дыбыстар жүйесінің математикалық моделі құрылды, қазақ

дыбыстары жасалым, естілім және қолданып тұрғысынан сипатталды.

Қазақ тілінің латын графикасына негізделген жаңа әліпбиін жасау қағидалары мен

есептері талданып, құрамында 100 миллион қазіргі қолданып жүрген кирилл әліпбиінің

әріптері бар мәтіндік корпус құрып, ондағы әріптердің және әріптер тіркестерінің кездесу

жиіліктері анықталды.

Қазақ тілінің латын графикасына негізделген жаңа әліпбиін құрастырудың

әдістері тұрғызылды, ол үшін қазақ тілінің мәтіндік корпусындағы дыбыстарының

жиіліктері ескерілді және қазақ тіліндегі мәтіндерді кириллицадан латиницаға аударатын

конвертор-программалық өнім заманауи программалау тілдері мен технологияларын

қолданылып жасалды.

Қазақша мәтіндерді кириллицадан латиницаға және керісінше аудару алгоритмі

әзірленді және ол программалық жүзеге асырылып, Интернетте жарияланып, ашық

қолданысқа берілді.

Қазақ тілінің латиницадағы орфографиялық емлелері анықталып, орфографиялық

электрондық сөздік құрастырылып, Интернетте жарияланып, ашық қолданысқа берілді.

Қазақ тілінің латиницадағы жазбалары үшін морфологиялық және синтаксистік

ережелерінің онтологиялық және математикалық моделдері құрылды.

Қазақ тілінің латиницадағы жазбаша жай және құрмалас сөйлемдерін талдау мен

құру алгоритмдері әзірленді және олар программалық жүзеге асырылып морфологиялық

және синтаксистік анализаторлар Интернетте жарияланып, ашық қолданысқа берілді.

Қазақ терминдерінің латиницадағы көпсалалы электрондық сөздігі Интернетте

жарияланып, ашық қолданысқа берілді.

Қазақ тілі бойынша латницада көпдеңгейлі электрондық оқу басылымы

Интернетте жарияланып, ашық қолданысқа берілді.

Ққазақ тілінің латиницада веб-порталы Интернетте жарияланып, ашық

қолданысқа берілді.

ҒЗЖ жасау барысында алынған нәтижелер халықаралық конференцияларда

баяндалды, ғылыми баспаларда жарияланды, солардың ішінде:

- 1 – мақала Thomson Reuters базасында индекстелетін журналда;

- 7 мақала Scopus базасында индекстелетін журналда;

Page 16: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

16

- 3 мақала ҚР БҒМөң БҒСБК ұсынған ғылыми журналда;

- 8 жариялым алыс шетелдегі халықаралық ғылыми конференциялар еңбектерінде;

- 3 жариялым жақын шетелдегі халықаралық ғылыми конференциялар еңбектерінде;

- 29 жариялым республикалық халықаралық ғылыми конференциялар еңбектерінде.

Осы ҒЗЖ аясында ғылыми-педагогикалық кадрлар дайындалуда:

Ж.Есенбаев «Шуылдар жағдайындағы белгілі сөздік негізінде қазақ сөйлеулерін

тану» атты PhD диссертация 6D060200 – Информатика мамандығы бойынша 2014 жылы

қорғалды.

А. Бөрібаева «Дифондар моделі негізінде қазақ сөздерін тану» атты PhD диссертация

6D060200 – Информатика мамандығы бойынша 2015 жылы қорғалады.

А. Муқанова «Қазақ тіліндегі білімдерді семантикалық өңдеу модельдері мен

әдістері» атты PhD диссертация 6D060200 – Информатика мамандығы бойынша 2015

жылы қорғалады.

Б. Кәрімжан «Қазақ тілі» атты PhD диссертация 6D060200 – Информатика

мамандығы бойынша 2016 жылы қорғалады.

У. Бегімтай «Қазақ тілінің интеллектуалды электрондық оқу басылымын жасау»,

PhD диссертация 6D060200 – Информатика мамандығы бойынша 2016 жылы қорғалады.

ҒЗЖ тақырыбына байланысты 2013 жылы 8 магистерлік диссертация, 2014 жылы 1

PhD диссертация, 8 магистерлік диссертация, 2015 жылы 3 PhD диссертация, 4

магистерлік диссертация қорғалды.

Page 17: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

17

1 ЛАТИНИЦАДАҒЫ ҚАЗАҚ СӨЙЛЕМДЕРІН ТАЛДАУ ЖӘНЕ ТУДЫРУ

ПРОГРАММАЛАРЫ

1.1. Латиницадағы қазақ тілінің сөйлемдерін талдау программалары

1.1.1. Латиницадағы қазақ тілінің жәй сөйлемдерін талдау программасы

Бұл бөлімде қазақ тілінің жай сөйлемдердің синтаксистік ережелерінің

онтологиялық және математикалық моделдерін тұрғызып, жәй сөйлемдерді талдау

алгоритмдерін құрып, программалық жүзеге асырылады [8].

Жай сөйлемдерді талдаудың міндеті оның сөйлем мүшелерін (Бастауыш,

толықтауыш, анықтауыш, пысықтауыш, баяндауыш) анықтау болып табылады.

Алгоритмнің жасалуы түсінікті болуы үшін онтологиялық модел 1.1-суретте көрсетілген.

Сурет 1.1. Жай сөйлемнің онтологиялық моделі

Қазақ тіліндегі сөйлемнің синтаксистік ережелерінің математикалық моделдерін

құру үшін контексті бос грамматиканы құрастырамыз [60, 61].

G = <N, Т, P, S> грамматикасы берілсін, мұндағы:

N ={сөйлем, бір мүшелі сөйлем, екі мүшелі сөйлем, үш мүшелі сөйлем,

төрт мүшелі сөйлем, бес мүшелі сөйлем, бастауыш, баяндауыш, анықтауыш,

Page 18: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

18

толықтауыш, пысықтауыш, <зат есім>, <тәуелді жалғаулы зат есім>, <көптік

жалғаулы зат есім>, <заттанған сын есім>, <көптік жалғаулы заттанған сын есім>,

<заттанған сан есім>, <жинақты сан есім>, <тәуелдік жалғаулы жинақты сан есім>,

<тәуелдік жалғаулы есепті сан есім>, <ретті сан есім>, <шақты шылаулы сан есім>,

<шамалы шылаулы сан есім>, <тәуелдік жалғаулы шақты шылаулы сан есім>, <тәуелдік

жалғаулы шамалы шылаулы сан есім>, <көптік жалғаулы шақты шылаулы сан есім>,

<көптік жалғаулы шамалы шылаулы сан есім>, <жіктеу есімдігі>, <сілтеу есімдігі>,

<сұрау есімдігі>, <тәуелдік жалғаулы өз>, <белгісіздік есімдігі>, <тәуелді жалғаулы

ешбір>, <зат есімге айналған етістік>, <де етістігі арқылы объектке айналған етістік>,

<объектке айналған одағай>, <объектке айналған шылау>, <объектке айналған үстеу>,

<етістік>, <барыс жалғаулы зат есім>, <табыс жалғаулы зат есім>, <жатыс жалғаулы зат

есім>, <шығыс жалғаулы зат есім>, <көмектес жалғаулы зат есім>, <барыс жалғаулы

заттанған сын есім>, <табыс жалғаулы заттанған сын есім>, <жатыс жалғаулы заттанған

сын есім>, <шығыс жалғаулы заттанған сын есім>, <көмектес жалғаулы заттанған сын

есім>, <барыс жалғаулы сан есім>, <табыс жалғаулы сан есім>, <жатыс жалғаулы сан

есім>, <шығыс жалғаулы сан есім>, <көмектес жалғаулы сан есім>, <барыс жалғаулы

жіктеу есімдігі>, <табыс жалғаулы жіктеу есімдігі>, <жатыс жалғаулы жіктеу есімдігі>,

<шығыс жалғаулы жіктеу есімдігі>, <көмектес жалғаулы жіктеу есімдігі>, <барыс

жалғаулы есімше>, <табыс жалғаулы есімше>, <жатыс жалғаулы есімше>, <шығыс

жалғаулы есімше>, <көмектес жалғаулы есімше>, <сын есім>, <ілік жалғаулы зат есім>,

<ілік жалғаулы сын есім>, <ілік жалғаулы сан есім>, <сілтеу есімдігі>, <өздік есімдік>,

<жалпылау есімдігі>, <белгісіздік есімдігі>, <есімше>, <еліктеуіш сөздер>, <ілік

жалғаулы есімше>, <ілік жалғаулы үстеу>, <ілік жалғаулы жіктеу есімдігі>, <үстеу>,

<көсемше>, <барыс жалғаулы сөз>, <табыс жалғаулы сөз>, <жатыс жалғаулы сөз>,

<шығыс жалғаулы сөз>, <барыс жалғаулы шейін шылауы тіркескен сөз>, <барыс

жалғаулы дейін шылауы тіркескен сөз>, <барыс жалғаулы бола шылауы тіркескен сөз>,

<барыс жалғаулы қарай шылауы тіркескен сөз>, <барыс жалғаулы таман шылауы

тіркескен сөз>, <шығыс жалғаулы кейін шылауы тіркескен сөз>, <шығыс жалғаулы ары

шылауы тіркескен сөз>, <шығыс жалғаулы бұрын шылауы тіркескен сөз>, <шығыс

жалғаулы соң шылауы тіркескен сөз>, <көмектес жалғаулы бірге шылауы тіркескен сөз>,

<көмектес жалғаулы қабат шылауы тіркескен сөз>, <көмектес жалғаулы қатар шылауы

тіркескен сөз>, <арқылы шылауы тіркескен сөз>, <арқасында шылауы тіркескен сөз>,

<үшін шылауы тіркескен сөз>, <сайын шылауы тіркескен сөз> }

Page 19: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

19

T={ семантикалық база сөздері (мен, сен, сіз, ол, біз, сендер, сіздер, олар, кітап, үй,

ыстық, артық, түсіне, жазатын, алты, сегіз, кім, келген, қорқып, кеше, үсті, барды,

оқыды, қара, кел, оқушылар, тапсырма, жаңа, игерді, тез және тағы басқалары)}

S - <сөйлем>,

Р жиынындағы ережелер келесі түрде беріледі:

сөйлем

бастауыш

бастауыш баяндауыш

бастауыш толықтауыш баяндауыш

бастауыш пысықтауыш баяндауыш

бастауыш толықтауыш пысықтауыш баяндауыш

бастауыш пысықтауыш толықтауыш баяндауыш

бастауыш анықтауыш толықтауыш баяндауыш

толықтауыш анықтауыш бастауыш баяндауыш

толықтауыш пысықтауыш бастауыш баяндауыш

толықтауыш бастауыш пысықтауыш баяндауыш

пысықтауыш бастауыш толықтауыш баяндауыш

анықтауыш бастауыш толықтауыш баяндауыш

анықтауыш бастауыш пысықтауыш баяндауыш

бастауыш пысықтауыш анықтауыш толықтауыш баяндауыш

бастауыш анықтауыш толықтауыш пысықтауыш баяндауыш

пысықтауыш бастауыш анықтауыш толықтауыш баяндауыш

пысықтауыш толықтауыш анықтауыш бастауыш баяндауыш

анықтауыш бастауыш пысықтауыш толықтауыш баяндауыш

анықтауыш бастауыш толықтауыш пысықтауыш баяндауыш

анықтауыш толықтауыш бастауыш пысықтауыш баяндауыш

<бастауыш> <зат есім> <тәуелді жалғаулы зат есім> <көптік жалғаулы зат

есім> | <заттанған сын есім> <көптік жалғаулы заттанған сын есім> <заттанған сан

есім> <жинақты сан есім> <тәуелдік жалғаулы жинақты сан есім> <тәуелдік жалғаулы

есепті сан есім> <ретті сан есім> <шақты шылаулы сан есім> <шамалы шылаулы сан

есім> <тәуелдік жалғаулы шақты шылаулы сан есім> <тәуелдік жалғаулы шамалы

шылаулы сан есім> <көптік жалғаулы шақты шылаулы сан есім> <көптік жалғаулы

шамалы шылаулы сан есім> <жіктеу есімдігі> | <сілтеу есімдігі> <сұрау есімдігі> |

Page 20: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

20

<тәуелдік жалғаулы сөз> | <белгісіздік есімдігі> | <тәуелді жалғаулы ешбір> <зат есімге

айналған етістік> <де етістігі арқылы объектке айналған етістік> <объектке айналған

одағай> <объектке айналған шылау> <объектке айналған үстеу>

<баяндауыш>

<етістік>

<толықтауыш>

<барыс жалғаулы зат есім> <табыс жалғаулы зат есім> <жатыс жалғаулы зат есім>

<шығыс жалғаулы зат есім> <көмектес жалғаулы зат есім> <барыс жалғаулы

заттанған сын есім> <табыс жалғаулы заттанған сын есім> <жатыс жалғаулы

заттанған сын есім> <шығыс жалғаулы заттанған сын есім> <көмектес жалғаулы

заттанған сын есім> <барыс жалғаулы сан есім> <табыс жалғаулы сан есім>

<жатыс жалғаулы сан есім> <шығыс жалғаулы сан есім> <көмектес жалғаулы сан

есім> <барыс жалғаулы жіктеу есімдігі> <табыс жалғаулы жіктеу есімдігі>

<жатыс жалғаулы жіктеу есімдігі> <шығыс жалғаулы жіктеу есімдігі> <көмектес

жалғаулы жіктеу есімдігі> <барыс жалғаулы есімше> <табыс жалғаулы есімше>

<жатыс жалғаулы есімше> <шығыс жалғаулы есімше> <көмектес жалғаулы

есімше>

<анықтауыш>

<сын есім> <ілік жалғаулы зат есім>| <ілік жалғаулы сын есім>| <ілік жалғаулы сан

есім>| <сын_есім> <сілтеу есімдігі>| <өздік есімдік>| <жалпылау есімдігі>|

<белгісіздік есімдігі>| <есімше>| <еліктеуіш сөздер> <ілік жалғаулы есімше>| <ілік

жалғаулы үстеу>|<ілік жалғаулы жіктеу есімдігі>

<пысықтауыш>

<үстеу> <сын есім>| <көсемше> <барыс жалғаулы сөз> <жатыс жалғаулы сөз>

<шығыс жалғаулы сөз> <барыс жалғаулы шейін шылауы тіркескен сөз> <барыс

жалғаулы дейін шылауы тіркескен сөз> <барыс жалғаулы бола шылауы тіркескен

сөз> <барыс жалғаулы қарай шылауы тіркескен сөз> <барыс жалғаулы таман

шылауы тіркескен сөз> <шығыс жалғаулы кейін шылауы тіркескен сөз> <шығыс

жалғаулы ары шылауы тіркескен сөз> <шығыс жалғаулы бұрын шылауы тіркескен

сөз> <шығыс жалғаулы соң шылауы тіркескен сөз> <көмектес жалғаулы бірге

шылауы тіркескен сөз> <көмектес жалғаулы қабат шылауы тіркескен сөз>

<көмектес жалғаулы қатар шылауы тіркескен сөз> <арқылы шылауы тіркескен

Page 21: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

21

сөз> <арқасында шылауы тіркескен сөз>| <үшін шылауы тіркескен сөз> <сайын

шылауы тіркескен сөз>

<зат есім> oqushy, kitap, uej, saghat

<тәуелді жалғаулы зат есім> oqushym, kitapbym, uejim, saghatym

<көптік жалғаулы зат есім> oqushylar, kitaptar, uejler, saghattar

<заттанған сын есім> molshylyq, danyshpan

<көптік жалғаулы заттанған сын есім> zhaqsylar, uelkender

<заттанған сан есім> bes, zhujyrma

<жинақты сан есім> ekeu, uesheu, beseu

<тәуелдік жалғаулы жинақты сан есім> ekeuі, uesheuі, beseuі

<ретті сан есім> birinshi, ekinshi, altynshy

<шақты шылаулы сан есім> on shaqty, zhuez shaqty

<шамалы шылаулы сан есім> zhuez shamaly

<тәуелдік жалғаулы шақты шылаулы сан есім> on shaqtym, zhuez shaqtym

<тәуелдік жалғаулы шамалы шылаулы сан есім> zhuez shamalysy

<көптік жалғаулы шақты шылаулы сан есім> on shaqtylar, zhuez shaqtylar

<көптік жалғаулы шамалы шылаулы сан есім> zhuez shamalylar

<жіктеу есімдігі> men, siz, sen, ol, biz, sizder, sender, olar

<сілтеу есімдігі> bul, mynau, sol

<сұрау есімдігі> kim, ne, qalaj, qandaj

<тәуелдік жалғаулы өз> oezim, oezing, oezi

<белгісіздік есімдігі> kejbireu, qajsabireu

<тәуелді жалғаулы ешбір> eshbir, eshbiring

<зат есімге айналған етістік> biletinder

<де етістігі арқылы объектке айналған етістік> koerdim degen, bilemin degen

<объектке айналған одағай> aejt-shu

<объектке айналған шылау>

<тәуелді жалғаулы объектке айналған үстеу> ertengi

<етістік> koerdim, bardym, oqydym, keledi, bardy, ajtty

<барыс жалғаулы зат есім> oqushygha, kitapqa, uejge, saghatqa

<табыс жалғаулы зат есім> oqushyny, kitapty, uejdi, saghatty

<жатыс жалғаулы зат есім> oqushyda, kitapta, uejde, saghatta

<шығыс жалғаулы зат есім> oqushydan, kitaptan, uejden, saghattan

Page 22: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

22

<көмектес жалғаулы зат есім> oqushymen, кітаппен, uejmen, saghatpen,

oqushyменен, кітаппенен, uejmenen

<барыс жалғаулы заттанған сын есім> molshylyqqa, danyshpangha

<табыс жалғаулы заттанған сын есім> molshylyqty, danyshpandy

<жатыс жалғаулы заттанған сын есім> molshylyqta, danyshpanda

<шығыс жалғаулы заттанған сын есім> molshylyqtan, danyshpanman

<көмектес жалғаулы заттанған сын есім> molshylyqpen, danyshpanpen,

molshylyqpenen, danyshpanmenen

<барыс жалғаулы сан есім> ekige, ueshke, алтыға

<табыс жалғаулы сан есім> ekini, ueshti, алтыны

<жатыс жалғаулы сан есім> ekide, ueshte, алтыда

<шығыс жалғаулы сан есім> ekiden, ueshten, алтыдан

<көмектес жалғаулы сан есім> ekimenн, ueshpen, алтымен, ekimenen, ueshпенен,

алтыменен

<барыс жалғаулы жіктеу есімдігі> маған, сізге, саған, оған, бізге, сіздерге,

сендерге, оларға

<табыс жалғаулы жіктеу есімдігі> мені, сізді, сені, оны, бізді, сіздерді, сендерді,

оларды

<жатыс жалғаулы жіктеу есімдігі> менде, сізде, сенде, бізде, сіздерде, сендерде,

оларда

<шығыс жалғаулы жіктеу есімдігі> менен, сізден, сенен, бізден, сіздерден,

сендерден, олардан

<көмектес жалғаулы жіктеу есімдігі> менімен, сізбен, сенімен, онымен, бізбен,

сіздермен, сендермен

<барыс жалғаулы есімше> айтқанға, көрсеткенге, оқығанға

<табыс жалғаулы есімше> айтқанды, көрсеткенді, оқығанды

<жатыс жалғаулы есімше> айтқанда, көрсеткенде, оқығанда

<шығыс жалғаулы есімше> айтқаннан, көрсеткеннен, оқығаннан

<көмектес жалғаулы есімше> айтқанмен, көрсеткенмен, оқығанмен,

айтқанменен, көрсеткенменен

<сын есім> жақсы, қызыл, көк

<ілік жалғаулы зат есім> oqushyның, kitaptyң, uejding, saghattyng

<ілік жалғаулы сын есім> жақсының, қызылдың, көктің

Page 23: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

23

<ілік жалғаулы сан есім> бірдің, ekiнің, төрттің, алтының

<өздік есімдік> өз

<жалпылау есімдігі> бәрі, барлық, бар, барша, күллі, бүкіл, бүтін, түгел

<белгісіздік есімдігі> ешбір, ешкім, ешқайсысы, ештеңе

<есімше> айтқан, көрген, оқыған

<еліктеуіш сөздер> гүрс, тарс, сырт

<ілік жалғаулы есімше> айтқанның, көргеннің, оқығанның

<ілік жалғаулы үстеу> алыстың, жақынның, бүгіннің

<ілік жалғаулы жіктеу есімдігі> менің, сіздің, сенің, оның, біздің, сіздердің,

сендердің, олардың

<үстеу> алыс, жақын, бүгін

<көсемше> айтып, келіп, көріп, айта, бере

<барыс жалғаулы сөз> мектепке, ауылға, қалаға

<жатыс жалғаулы сөз> мектепте, ауылда, қалада

<шығыс жалғаулы сөз> мектептен, ауылдан, қаладан

<барыс жалғаулы шейін шылауы тіркескен сөз> соңына шейін

<барыс жалғаулы дейін шылауы тіркескен сөз> uejge дейін, ауылға дейін

<барыс жалғаулы бола шылауы тіркескен сөз> kitapqa бола, емтиханға бола

<барыс жалғаулы қарай шылауы тіркескен сөз> uejge қарай, мектепке қарай

<барыс жалғаулы таман шылауы тіркескен сөз> кешке таман, беске таман

<шығыс жалғаулы кейін шылауы тіркескен сөз> сабақтан кейін, оқудан кейін

<шығыс жалғаулы ары шылауы тіркескен сөз> сабақтан кейін, оқудан кейін

<шығыс жалғаулы бұрын шылауы тіркескен сөз> сабақтан бұрын, оқудан бұрын

<шығыс жалғаулы соң шылауы тіркескен сөз> сабақтан соң, оқудан соң

<көмектес жалғаулы бірге шылауы тіркескен сөз> oqushyлармен бірге,

жастармен бірге

<көмектес жалғаулы қабат шылауы тіркескен сөз> сабақпен қабат, үймен қабат

<көмектес жалғаулы қатар шылауы тіркескен сөз> сабақпен қатар, үймен қатар

<арқылы шылауы тіркескен сөз> су арқылы, нүкте арқылы

<арқасында шылауы тіркескен сөз> атасының арқасында, білімнің арқасында

<үшін шылауы тіркескен сөз> бала үшін, елі үшін

сайын шылауы тіркескен сөз> ай сайын, күн сайын, жыл сайын

Page 24: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

24

Жай сөйлемдерді талдаудың алгоритмі төменде көрсетілген:

1. Жай сөйлем оқылады

2. Бастапқы сөздер сөздігі ашылады

3. Жай сөйлемдердің жасалу жолдарының ережелері жазылады

4. Оқылған жай сөйлем жеке сөздерге бөлінеді

5. Оқылған жай сөйлем мен ережелер сәйкестігі табылады

5.1 Бастауышты анықтау

5.2 Толықтауышты анықтау

5.3 Анықтауышты анықтау

5.4 Пысықтауышты анықтау

5.5 Баяндауышты анықтау

6. Жай сөйлемдердің түрі анықталады

7. Соңы.

Жай сөйлемдерді талдауды автоматтандыру табиғи тілдің синтаксистік

құрылымдарын анықтауға және оның құрылымдық теориясы мен компьютерлік моделін

құруға қатысты есептерді шешуге бағытталған.

Protege программалау ортасында құрылған жай сөйлемдердің онтологиялық моделін

негізге ала отырыпжай сөйлемдерді талдау алгоритмі программалық жүзеге асырылды

(Сурет 1.2). Ол үшін келесі программалық құралдар таңдап алынды.

tuProlog – интернет қосымшалармен жұмыс жасауға арналған Prolog тілінің Java-ға

негізделген ықшам түрі.

WaveMaker – қолдануға жеңіл, drag & drop көмегімен дайын AJAX-виджеттер, веб-

сервистер, деректерге қолжетімділік компоненттері секілді веб-қосымшаларды

дайындауға арналған визуалды орта.

PostgreSQL – объектілі реляциялық деректер базасын басқару жүйесі(ORDBMS), ол

Калифорния Университетінде жасалынған.

Алынған веб-қосымшаның бас терезесін суреттен көруге болады. Сөйлемдерді

талдау алгоритмін программалық жүзеге асыру Prolog тілінде жазылған ережелерді/

tuProlog объектілеріне жүктеуден басталады. Содан кейін ережелер мен фактілерді,

олармен жұмыс жасауды ыңғайлы ету үшін реляциялық деректер базасының жазбаларына

ауыстырылады, сонымен қатар Java сервистерін жазу керек.

Page 25: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

25

Сурет 1.2. Жай сөйлемдерді өңдеу жүйесінің бас терезесі

1.1.2. Латиницадағы қазақ тілінің құрмалас сөйлемдерін талдау программасы

Құрмалалас сөйлемдерді талдау жай сөйлемдер деңгейіне дейін жүргізіледі.

Жобаның бірінші кезеңінде жасалған құрмалас сөйлемдердің ережелері мен онтологиялық

моделінің /9/ негізінде құрмалас сөйлемдерді талдау алгоритмі жасалды.

Құрмалас сөйлемдерді талдау алгоритмі NetBeans IDE 6.9.1 программалау

ортасында Java тілінде программалық жүзеге асырылды. Java – қолданбалы

программалаудың әмбебап тілі, Sun Microsystems корпорациясы жобасының негізінде

1995 жылы жасалды. NetBeans IDE 6.9.1 программалау ортасында компонеттермен жұмыс

істегенде, тек процедура жазып қана емес, олардың қасиеттерін өзгерте отырып, әр түрлі

нәтижелерге қол жеткізуге мүмкіндік бар.

Құрмалас сөйлемдерді талдау үшін сөздер арнайы құрылған белгілі бір деректер

базасында сақтаймыз. Біздің жағдайымызда деректер қоры Sqlite Expert Personal 3

программалық пакетінде құрылды. Әр сөздің өзінің семантикалық белгілері болады. Ол

семантикалық белгілер 0-9 сандар мен латынның a,b,c.. әріптерімен белгіленіп, бұтақ

құрады.

Осы семантикалық кесте Sqlite Expert Personal 3-те «sozder» және «soylem» деген екі

кестеге бөлініп жазылған. Оның бірінде сөздердің сөйлем мүшелеріне байланысты коды,

Page 26: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

26

екіншісінде сөздерден құралған сөйлемнің коды үшін семантикалық белгілер жазылған.

Бұл формада «Өңдеу» батырмасын орналастырамыз. Мұндағы «Өңдеу» батырмасы 3

компоненттен тұрады: Сарапшы, Құру және Талдау.

Құрмалас сөйлемді талдау терезесінде нәтиже алу үшін біз сөйлемді енгізіп көреміз.

Мысалы, Өзге елдің сұлтаны болғанша, өз еліңнің ұлтаны бол (Сурет 21). Сөйлемді

енгізген соң біз оның синтаксистік талдауын көре аламыз. Яғни, енгізілген құрмалас

сөйлемнің жасалу жолы, оның түрі және қай сйлемдері туралы мәліметтер аламыз.

Сурет 21 - Құрмалас сөйлемдерді өңдеу жүйесінің терезесі

3- бөлімде көрсетілген зерттеулердің бағасы:

Алынған нәтижелер:

қазақ тілінің сөз тіркестерін талдау алгоритмдері және программалары;

қазақ тілінің жай сөйлемдерін талдау алгоритмдері және программалары;

қазақ тілінің құрмалас сөйлемдерін талдау алгоритмдері және программалары;

Қойылған есептің шешілуінің толықтығы және жұмыстың келесі бағыттары

бойынша ұсыныстар:

Қазақ тіліндегі сөз тіркестері мен сөйлемдерді талдау алгоритмдері синтаксистік

ережелерді толық қамтиды. Зерттеудің осы деңгейінде алынған формалды ережелер

арқылы сөз түрлендіру, тудырудың және талдаудың алгоритмдері қарастырылған.

Алынған нәтижелердің сенімділік бағасы:

Page 27: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

27

Алынған нәтижелер сенімді болып табылады, себебі, қазақ тілінің морфологиясына

қатысты барлық ережелер қамтылған, көрсетілген алгоритмдер арқылы қазақ тілінің

жазбаша сөздерін тудыру мен талдау процестері жүзеге асырылған.

Отандық және шетелдік жұмыстардың нәтижелерімен салыстыру:

Сөз тіркестерін оның бөлімдерінің байланысуының түріне (қабысу, матасу, меңгеру,

қиысу, жанасу), өзара тіркесу қабілетіне: еркін(есімді және етістікті), тұрақты және)

қатысты талдауға болады. Біздің ұсынып отырғанымыз еркін тіркестің түрлеріне (есімді

және етістікті) және байланысу тәсілдерінің ішіндегі жалғаулар арқылы, септеулік

шылаулар арқылы және орын тәртібі арқылы түрлеріне қарай талдаулар алгоритмдері.

Ғылыми зерттеудің бұл бөлімін отандық және шетелдік жұмыстардың

нәтижелерімен салыстыру үшін төмендегілерді келтіруге болады:

Орыс тіліндегі сөйлемдер сегменттерге бөлу жолымен синтаксистік талданды /12/.

Біздің ұсынып отырғанымыз сөйлемдердің жасалу жолдарымен берілген сөйлемдердің

сәйкестіктерін тексеру арқылы талдау алгоритмі. Қазақстанда қазақ тілінің тілдік

технологияларының проблемаларымен осы жобаны ұсынып отырған ғалымдар

толыққанды айналысады. «Изет» ЖШС – қазақ тілін тану қарастырылады. Дегенмен, бұл

зерттеулердің сипаттамасы мен нәтижесін көрсететін ғылыми мақалалары жоқ.

Сондықтан, біз осы жұмыстардың ғылыми жаңалығы мен құндылығын бағалай алмаймыз.

Жобадағы зерттеулер жаңа ғылыми бағытқа жатады. Қазақ тілі үшін жұмыс істеп

жатқан мәтіндерді өңдеу жүйелері жоқ. Осы бөлімді орындау барысында қазақ тілінің

сөйлемдерін талдаудың алгоритмдері жасалды. Жасалынған алгоритмдер программалық

түрде жүзеге асырылды, бұл жобаның ғылыми және қолданбалы жаңалығын растайды.

Жасалынған сөйлемдерді талдаудың алгоритмдері мен программалары автоматты

өңдеу мен іздеу жүйелері және қазақ тілінің ауызша сөйлемдерін танудың программалық

модулдерін дайындауға қолданылады.

1.2. Латиницадағы қазақ тілінің сөйлемдерін тудыру программалары

1.2.1. Латиницадағы қазақ тілінің жәй сөйлемдерін тудыру программасы

Жай сөйлемдерді тудырудың міндеті берілген сөздерден сөйлемдердің жасалу

жолына сәйкес дұрыс сөйлем құру.

Қазақ тіліндегі сөйлемдерді тудыру алгоритмі

Сөйлемдерді тудыру мақсатында бұрын қарастырылған G грамматикасының

бейтерминальды құрамы Prologтың предикаттарына, ал оның тережелері Prolog тілінің

ережелері мен фактілеріне түрлендірілген.

Page 28: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

28

Сөйлемді құратын сөздер семантикалық сипаттарға ие объектілер болып табылады.

Сондықтан олардың семантикалық белгілері предикаттармен анықталған. Олардың

мәндері программалау ортасындағы деректер базасында сақталынған, яғни файлдарда.

Мәндерді жүктеу ORM арқылы деректер базасына сұрату жасаумен жүріледі:

1. Session session = serviceDB.getDataServiceManager().getSession();

2. Query query = session.createQuery("select id AS id, str AS str, enabled AS enabled, des

cr AS descr, f.category AS category from Fact AS f where theory_id=:theory_id");

3. query.setParameter("theory_id", theoryId);

4. factTable = query.setResultTransformer(Transformers.aliasToBean(Fact.class)).list();

5. for (Fact fact : factTable) {

6. if (fact.getCategory().getEnabled().booleanValue()) {

7. if (fact.getEnabled().booleanValue()) {

8. s.append(fact.getCategory().getNameProl() + "(\"" + fact.getStr() + "\").\n");

9. }

10. }

11. }

bact(X) :- zat(X). bact(X) :- tjal_zat(X). bact(X) :- kjal_zat(X). bact(X) :- zat_cyn(X)

ережелер типі деректер базасынан келесі әдістер арқылы жүктеледі:

1. Query query2 = session.createQuery("select id AS id, enabled AS enabled, descr

AS descr, spc.sentencepart as sentencepart, spc.category as category from SentencepartCategory

AS spc");

2. spcTable=query2.setResultTransformer(Transformers.aliasToBean(SentencepartC

ategory.class)).list();

3. for (SentencepartCategory spc : spcTable) {

4. if (spc.getSentencepart().getTheory().getId().intValue() == theoryId) {

5. if (spc.getSentencepart().getEnabled().booleanValue()) {

6. if (spc.getCategory().getEnabled().booleanValue()) {

7. if (spc.getEnabled().booleanValue()) {

8. s.append(spc.getSentencepart().getNameProl() + "(X) :-

" + spc.getCategory().getNameProl() + "(X).\n");

9. }

10. }

11. }

12. }

13. }

Page 29: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

29

Алгоритмнің толық жұмыс істеуі үшін, бұл предикаттардан басқа сөйлемдерді

«тіркестіру» мақсатында келесі предикаттар ұсынылды:

s.append("con([],L1,L1).\n");

s.append("con([X|Tail],L2,[X|Tail1]) :- con(Tail,L2,Tail1).\n");

Жиынның нәтижесінде келесі түрдегі предикаттарды алдық:

coilem3(X2,X1,X3,S) :- bact(X1), (tolyqtawys(X2), (baiandawys(X3), (con([X1],[X2],S1),

(con(S1,[X3],S))))).

Сөйлем құрастыру үшін sintez() әдісін қолдану керек:

1. public String sintez(String sozder) throws Exception {

2. log(ERROR, "sozder = " + sozder);

3. String resultList = "";

4. String[] tmp = sozder.split("\\|");

5. int num = tmp.length;

6. log(ERROR, "num = " + num);

7. String params = "";

8. for (int i = 0; i < num; i++) {

9. params = params + "\"" + tmp[i] + "\", ";

10. }

11. String question = "coilem" + num + "(" + params + "_).\n";

12. log(ERROR, "question = " + question);

13.

14. SolveInfo info = engine.solve(question);

15. while (info.isSuccess()) {

16. resultList = resultList + makeSentence(info.getSolution().toString()) + "\n";

17. if (engine.hasOpenAlternatives()) {

18. info = engine.solveNext();

19. } else {

20. break;

21. }

22. }

23. if (resultList.length() == 0) {

24. resultList = "Нет решений";

25. }

26. return resultList;

27. }

Page 30: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

30

28.

29. public String getTheory() {

30. return engine.getTheory().toString();

31. }

Мысалы:

result = sintez("mektepke|bardym|men");

result айнымалысына әдіс келесі жолды шығарып береді "Men mektepke bardym".

Мысалы, zhaudy, kshe, zhangbyr сөздер тобын енгізгенде алгоритмнің орныдалуын

қарастырайық. Сөздердің сөйлем мүшелері бола алатынын тексеру үшін келесі

қадамдарды жасаймыз:

1. Сөздер оқылады.

2. Әр бір сөз семантикалық деректер базасына сәйкес зерттелінеді және оның

сөйлемнің қандай мүшесі болатыны анықталынады:

жауды – етістік, ол келесі ережені қанағаттандырады: baiandawys(BN):- etyctyk(BN);

кеше – үстеу, ол келесі ережені қанағаттандырады: pycyqtawys(S):- uctew(S).;

жаңбыр – зат есім, ол келесі ережені қанағаттандырады: bact(BS):- zat(BS)..

3. Бұл қадамда сөйлемнің анықталған мүшелерінің ережеде келтірілген тәтіпке

сәйкес орналасу реті тексеріледі:

Ережеге сәйкес келеді coilem3(Bs, P, Bn, S):-bact(Bs), pycyqtawys(P), baiandawys(Bn).

4. generateParam() Java әдісінің көмегімен

1. private void generateParam(StringBuilder prolTheory, String clause, int count, int

[] arrIndx, int k) {

2. if (k == count) {

3. String str = "";

4. for (int i = 1; i <= count; i++) {

5. str = str + "X" + arrIndx[i-1] + ", ";

6. }

7. str = str.substring(0, str.length()-2);

8. String res = String.format(clause, str);

9. //log(ERROR, "generateParam = " + res);

10. prolTheory.append(res); // %s

11. } else {

12. if (count > 1) {

13. for (int j = k + 1; j <= count; j++) {

14. int tmp = arrIndx[k + 1-1];

Page 31: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

31

15. arrIndx[k + 1-1] = arrIndx[j-1];

16. arrIndx[j-1] = tmp;

17. generateParam(prolTheory, clause, count, arrIndx, k + 1);

18. tmp = arrIndx[k + 1-1];

19. arrIndx[k + 1-1] = arrIndx[j-1];

20. arrIndx[j-1] = tmp;

21. }

22. } else {

23. String res = String.format(clause, "X1");

24. //log(ERROR, "generateParam = " + res);

25. prolTheory.append(res); // %s

26. }

27. }

28. }

, Бс + П + Бнтипі бойынша үш мүшелі сөйлемдегі сөздердің орналасуының

барлық мүмкін болатын комбинацияларын құрады.

coilem3(X1,X2,X3,S) :- bact(X1), (pycyqtawys(X2), (baiandawys(X3),

(con([X1],[X2],S1), (con(S1,[X3],S))))). coilem3(X1,X3,X2,S) :- bact(X1), (pycyqtawys(X2),

(baiandawys(X3), (con([X1],[X2],S1), (con(S1,[X3],S))))). coilem3(X2,X1,X3,S) :- bact(X1),

(pycyqtawys(X2), (baiandawys(X3), (con([X1],[X2],S1), (con(S1,[X3],S))))).

coilem3(X2,X3,X1,S) :- bact(X1), (pycyqtawys(X2), (baiandawys(X3), (con([X1],[X2],S1),

(con(S1,[X3],S))))). coilem3(X3,X2,X1,S) :- bact(X1), (pycyqtawys(X2), (baiandawys(X3),

(con([X1],[X2],S1), (con(S1,[X3],S))))). coilem3(X3,X1,X2,S) :- bact(X1), (pycyqtawys(X2),

(baiandawys(X3), (con([X1],[X2],S1), (con(S1,[X3],S))))).

tuProlog лайық ережені табады, осыдан орналасу ережесі шығады: Кеше жаңбыр

жауды.

Қазақ тіліндегі сөйлемдерді тудыру алгоритмін программалық жүзеге асырылуы

үшін қолданатын интерфейс жүйелері

Жүйеде қолданушылардың авториязациялау мүмкіншілігі қарастырылған. Логин

мен құпия кілтті енгізіп, Кіру батырмасын басу керек (сурет 23).

Page 32: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

32

Сурет 23 – Енгізу терезесі

Терезеге кіру арқылы қолданушы келесі интерфейсті көреді (сурет 24). Жүйемен

жұмыс жасау үш блокка бөлінеді: білім қоры, тудыру, сервис.Әрбір блоктың сол жағында

навигациялық мәзір орналасқан. Мәзірден «Теориялар» навигациялық пунктін

таңдаңыздар. Жүйеде бірнеше «теориялар» құру мүмкіндіктері, яғни сөйлемдерді тудыру

үшін бірнеше Проглог ережелер жиынтығы қарастырылған.

Сурет 24 – Веб-порталадың бастапқы интерфейсі

Келесі «Сөйлемдерді тудыру 2» теориясын таңдап, «Білім базасын жаңалау»

батырмасын басу керек, осы арқылы tuProlog ережесін жүктейміз (Пролог тілін құратын

класс).

«Категорияларжәне фактілер» бөлімінде, жүйені қолданушының Пролог уналрлық

қатынасын құру мүмкіндігі бар, негізінде бұлар « Сөз таптары». Төмендегі кесте

Page 33: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

33

жоғырыдағы кестеге тәуелді, мұнда сөз топтарын қосу және өзгерту мүмкіндіктері бар.

Мысалы «zat» атаулары категориялары , «Зат есімді» білдіреді, оған келесі сөздер жатады:

оқушы и доп (сурет 25).

Сурет 25– «Категориялар және фактілер» бөлімімен жұмыс

Келесі әрекет «Зат есім» категориясына «бала» сөзін қосу. Қосу батырмасын

басыңыз, содан кейін «Мән» өрісіне «бала» сөзін жазыңыз және «Сақтау» батырмасын

басыңыз (сурет 26).

Сурет 26 – Жүйемен жұмыс

Page 34: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

34

«Сөйлем мүшелері» бөлімінде, сөйлем мүшелері және сөз

таптары(категориялармен) арасындағы қатынас көрсетілген. Параметр «Қосылған»

параметрі алгоритмге сөйлем тудыруды хабарлау үшін арналған, берілген болмысты

немесе қатынасты сөйлем құру кезінде қолданады (сурет 27,28).

Сурет 27 – «Сөйлем мүшелері» Бөлімі

Сурет 28 – «Жай сөйлемдер» бөлімі

«Білімдер базасына сұраныс» бөлімі, Білімдер базасының жағдайын бақылау үшін

арналған (tuProlog объектісіне ережелерді жүктеу). ВСұраныстың келесі жолын еңгізіңіз:

«coilem4("естігенде", "барды", "оқушылар", "мектепке", _).», а содан кейін «Орындау»

батырмасын басыңыз.tuPrologқа сұраныстың орныдалуының нәтижесін төмендегі

кестеден көре аласыз (сурет 29).

Page 35: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

35

Сурет 29 - «Білімдер базасына сұраныс» бөлімі

«Компиляцияланған білімдер қоры» бөлімінде tuPrologға жүктелген барлық

ережелермен қатынастарды көресіздер, ол үшін «Көру» батырмасын басу керек (сурет 30).

«Тудыру» қосымшасын басыңыз. Сіздің алдыңызда құрастырылған «Білімдер қоры»

арқылы жай сөйлемдерді тудыруға мүмкіндік беретін бет ашылады. Сол жақтағы бетке

«Білімдер базасында» бар сөз еңгізу керек (максимум 5 сөз), мысалы: оқушылар, күзде,

барды, мектепке. Сөзді енгізгеннен кейін беттің ортасындағы «Тудыру» батырмасын

басыңыз (сурет 31). Беттің оң жағында «сөйлемдерді тудыру» орналасқан, жүйе берілген

сөздер арқылы дұрыс сөйлем құраудың нұсқасын ұсынады. Керек болған жағдайда сіз

сөзді ауыстыруыңызға және содан соң операцияны қайталауыңызға болады.

Сурет 30 – «Компиляцияланған білімдер қоры» бөлімі

Page 36: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

36

Сурет 31 –«Тудыру» қосымшасы

«Сервис» қосымшасында, қолданушыларды администратор басқара алады:

қолданушыларды қосу, берілгендерді өзгерту және қолданушыларды өшіру (Сурет 32).

Қолданушының 3 рөлі бар: администратор, эксперт, қолданушы. Администраторға

жүйенің барлық қызметі қолжетімді, эксперке «Сервис» бөлімінен басқаның барлығы, ал

қолданушыға «Тудыру» бөліміне ғана қолжетімділік бар.

Сурет 32 –«Сервис» Қосымшасы

Жүйемен жұмыс аяқталған соң,оң жақ бұрыштағы «Шығу» батырмасын басу керек.

Сонымен қатар, егер қолданушы көп уақыт белсенділік танытпаса жұмыс сессиясы мен

жүйе қатынасы үзіледі және жұмысты жалғастыру үшін браузер бетін өңдеу қажет.

Page 37: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

37

1.2.2. Латиницадағы қазақ тілінің құрмалас сөйлемдерін тудыру программасы

Құрмалалас сөйлемдерді тудыру жай сөйлемдер деңгейіне дейін жүргізіледі.

Жобаның бірінші кезеңінде жасалған құрмалас сөйлемдердің ережелері мен онтологиялық

моделінің негізінде құрмалас сөйлемдерді тудыру алгоритмі жасалды.

Құрмалас сөйлемдерді тудыру үшін жай сөйлемдер арнайы құрылған белгілі бір

деректер базасында сақтаймыз. Біздің жағдайымызда деректер базасы Sqlite Expert

Personal 3 программалық пакетінде құрылды. Әр жай сөйлемдер өзінің семантикалық

белгілері болады.

Осы семантикалық кесте Sqlite Expert Personal 3-те «soylem» деген кестеде жазылған.

Онда сөздерден құралған сөйлемнің коды үшін семантикалық белгілер жазылған. Бұл

формада «Өңдеу» батырмасын орналастырамыз. Мұндағы «Өңдеу» батырмасы 3

компоненттен тұрады: Сарапшы, Құру және Талдау.

Құрмалас сөйлемді тудыру терезесінде нәтиже алу үшін біз жай сөйлемдерді

енгіземіз. Мысалы, Маржан қанша күтсе де, бауырларынан хабар болмады құрмалас

сөйлемінің туындауы 33-суретте көрсетілген. Сөйлемді енгізген соң біз оның синтаксистік

тудыруын көре аламыз.

Құрмалас сөйлемдерді тудырғанда жай сөйлемді бүтін бір компонент ретінде

қарастырамыз.

Сурет 33 - Құрмалас сөйлемді құру

Жасалынған жазуларды тудырудың алгоритмдері мен программалары автоматты

өңдеу мен іздеу жүйелері және қазақ тілінің ауызша сөйлеулерін тудыру алгоритмдері мен

программаларының модулдерін дайындауға қолданылады.

Page 38: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

38

2 ЛАТИНИЦАДАҒЫ КӨПСАЛАЛЫ ҚАЗАҚ ТЕРМИНДЕРІНІҢ ДЕРЕКТЕР

БАЗАСЫ

Бұл бөлімде латиницада дайындалған көпсалалы қазақ терминдерінің деректер

базасы сипатталады.

Информатика, математика, механика, физика және химия бойынша орысша–қазақша

терминдер базасы жасалды. Жазбасында орыс әліпбиінің ё, и, э, у, я, ю, ь, ъ, ц, ч, щ әріптері

бар қазақ термин сөздер біз жасаған ережелер арқылы (1-Қосымша) латиницаға автоматты

аударылды http://alphabet.kz:81/latin/terms/index.php. Ал жазбасында осы көрсетілген

әріптері жоқ қазақ терминдері біз жасаған конвертердің көмегімен ешбір ережені

қолданбай-ақ латиницаға автоматты түрде аударылды.

Көпсалалы қазақ терминдер сөздігінің мұқабасы 1-суретте көрсетілген.

1-сурет. Латиницадағы көпсалалы қазақ терминдер сөздігі.

Латиницадағы көпсалалы қазақ терминдер сөздігінде бірінші әріп бойынша іздеу

қарастырылған.

3 ЛАТИНИЦАДАҒЫ ҚАЗАҚ ТІЛІ БОЙЫНША КӨПДЕҢГЕЙЛІ ЭЛЕКТРОНДЫҚ

ОҚУ БАСЫЛЫМЫН ДАЙЫНДАУ.

Бұл бөлімде қазақ тілі бойынша білім деңгейі және оған қойылатын талаптар

анықталған. Әрбір деңгей бойынша оқу материалдары жиналып, оның деректер базасы

жасалды.

Page 39: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

39

Латиницадағы қазақ тілі бойынша көпдеңгейлі электрондық оқу басылымының

(ЭОБ) сәулеті және пайдаланушы интерфейсі дайындалды.

Электрондық оқу басылымын http://alphabet.kz:81/latin/generator.php сайтынан

көшіріп алуға болады.

2-суретте қазақ тілі бойынша осы ЭОБ-ның мұқабасы көрсетілген

2-сурет. ЭОБ-ның мұқабасы.

Мұқабадағы«Avtorlar» және «Angdatpa» батырмалары ЭОБ-ны құрастыру кезінде

енгізілген ақпаратты көрсетеді. Ал «Taqyryptama» батырмасын басқанда ЭОБ-ның

құрылымын көрсететін терезе ашылады, ол 3-суретте.

3-сурет. ЭОБ құрылымы.

Page 40: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

40

“Mazmuny”батырмасы оқушыға жұмыс режімін таңдауға мүмкіндік береді, ол 4-

суретте көрсетілген.

4-сурет. Жұмыс режімін таңдау.

Бірінші «Qaraw rezhimi»режімін таңдағанда оқытатын программа оқу материалын

қарауды ғана қамтамасыз етеді. Мұнда тапсырмаларға, сұрақтарға және тестілерге қол

жетім болмайды. Қарау терезесі 5-суретте көрсетілген.

5-сурет. Қарау терезесі.

Page 41: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

41

Екінші «Testilew rezhimi» режімінде оқыту программасы оқу материалының барлық

көлемі бойынша тестілеуді қамтамасыз етеді. Мұнда тестілеу біткеннен кейін, оның

нәтижесі туралы ақпарат алуға болады. Тестілеу терезесі 6-суретте көрсетілген.

6-сурет. Тестілеу терезесі.

Үшінші «Oqytudy bastaw rezhimi» режімінде оқыту программасы оқушыға оқуды

бастауға мүмкіндік береді. Оқуды бастау үшін оқушы оқыту программасында тіркелуі

керек.Тіркелу терезесі 7-суретте көрсетілген.

7-сурет. Тіркеу терезесі.

Бұл режімде оқытатын программа оқу траекториясын таңдауға мүкіндік береді.

Мұнда ағымдағы сабақ бойынша теориялық материалды оқып білгеннен кейін, тестілік

Page 42: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

42

сұрақтарға жауап беруге тура келеді. Дұрыс жауаптардың саны жеткіліксіз болған

жағдайда, оқушы осы траекториядағы келесі сабаққа өте алмай, ағымдағы сабақты оқуын

жалғастыра береді.

Ағымдағы тетілеумен қатар, келесі блокқа көшкенде, аралық тестілеу, келесі

модулға көшкенде белестік тестілеу, ал ЭОБ бойынша оқуды аяқтаған кезде нәтижелік

тестілеу қарастырылған.

Төртінші «Oqytudy zhalgastyru rezhimi» режімінде оқытатын программа таңдалған

траектория бойынша оқуды жалғастыруды қамтамасыз етеді. Мұнда оқу үдерісі үзілімнен

кейінгі келесі сабақтан басталады.

Оқытудың бастау режімі үш оқыту траекториясының біреуін таңдауға мүмкіндік

береді: қолмен таңдау, тестілік таңдау, толық таңдау.

Траекторияны таңдау және оқыту терезесі 8-суретте көрсетілген.

Рисунок 8 - Форма выбора траектории обучения

При ручном выборе траектория определяется обучаемым самостоятельно путем отметки

номеров модулей, блоков, уроков, как показано на рисунке 9.

Page 43: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

43

9-сурет. Қолмен таңдау.

Траекторияны тестілік таңдағанда траектория оқу материалының барлық көлемі

бойынша тестілеу нәтижесі арқылы автоматты түрде анықталады. Бұл жағдайда оқу

траекториясына дұрыс жауаптар саны жеткіліксіз сабақтар ғана кіреді. Толық таңдау

траекторияға осы пән бойынша оқу материалының барлық көлемін, барлық модулдар,

блоктар және сабақтарды кіргізеді. Траектория анықталғаннан кейін оқушы 10-суретте

көрсетілген оқыту терезесіне тікелей көшеді.

10-сурет. Оқыту терезесі.

Page 44: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

44

Сөйтіп, әрбір мұғалым өзінің электрондық оқу басылымын латиницада жасай

алады. Оның құрылымы мен мазмұны қолдану мақсатына байланысты.

4 ЛАТИНИЦАДА ҚАЗАҚ ТІЛІНІҢ ВЕБ-ПОРТАЛЫН ДАЙЫНДАУ

Бұл бөлімде латиницада жасалған қазақ тілінің веб-орталын сипаттаймыз. Веб-

порталының адресі: http://alphabet.kz/.

Қазақ тілінің веб-орталының мұқабасы 11-суретте көрсетілген.

11-Сурет. www.alphabet.kz сайт мұқабасы.

Порталдың бас бетінде жасаушылар («Жасаушы» батырмасы) сайтына көшу,

орфографияны оқып білу («Орфография» батырмасы), негіздемемен танысу («Негіздеме»

батырмасы), бейне материалдар мен статьяларды қарау («Талдау» батырмасы). Сонымен

қатар бұл бетте сайтқа қатынасушылар (пайдаланушылар) үшін пікір қалдыру

мүмкіншілігі қарастырылған.

12-суретте «Конвертация» батырмасын басқан кезде қазақ тіліндегі мәтінді

кириллицадан латиницаға аудару көрсетілген.

Page 45: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

45

12-Сурет. Мәтінді конверттеу беті.

Қазақ әліпбиін латын графикасына көшірудің мынадай қағидаларын ұсынамыз:

1. Әліпби тек қана қазақ тілінің дыбыстық жүйесіне негізделіп жасалуы керек.

Бұл қазақ тілінің заңдылығына қайшы кірме дыбыстарды алып тастауды талап етеді.

2. Әліпбиде қазақ тілі дыбыстарын стандартты пернетақтада қамтылған

латын әріптерімен ғана таңбалау керек. Бұл компьютерлер мен телекоммуникациялық

құралдарда қосымша қаржы талап ететін шрифтер мен драйверлерді орнатпай-ақ қазақ

тілінде ақпаратты ендіруге, өңдеуге және шығаруға мүмкіндік береді.

3. Әліпбиде қазақ дыбыстарының кейбіреулерін таңбалау үшін латын

әріптерінің мәнін өзгерту керек. Бұл латын әріптерін қазақша дыбыстауды талап етеді

және осы мәнде, олар қазақ әліпбиінің әріптері болып есептеледі.

4. Латын әріпі жетпеген дыбысты таңбалауда әріптер тіркесі алыну керек. Бұл

кейбір дыбысты таңбалау үшін дыбысталуы осы дыбысқа жақын әріпке қазақ мәтінінде

тіркесі өте аз әріпті тіркеу ережесін жасауды талап етеді.

5. Әліпбиде әріптердің орналасу реті ағылшын әліпбиіндегі ретке сәйкес болуы

керек. Бұл ақпараттық ресурстарды қазақ тілінде жасау немесе қолдану кезінде қосымша

сұрыптау және іздеу программаларын жасамай-ақ, барлық жүйелік программалық

қамтамада бар сұрыптау және іздеу программаларын ешқандай шығынсыз және кедергісіз

пайдалануға мүмкіндік береді.

Жоғарыдағы қағидаларға сәйкес қазақ тілінің дыбыстарын базалық латын

әріптерімен белгіледі қарастырайық. Бізде базалық латын әліпбиінің 26 әріпі бар және

қазақ тілінінің 31 дыбысы (28 төл дыбыс, 3 қосатын дыбыс) бар. Сондықтан біз қазақ

Page 46: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

46

сөздерінің жазуын ұзартпайтын әліпбиді анықтау үшін, мына 3 есепті шешуіміз керек:

1) Жалғыз әріппен ғана белгіленетін дыбыстарды анықтау.

2) Әріп пен көмекші таңба тіркесімен белгіленетін дыбыстарды анықтау.

3) Көмекші таңбаны анықтау.

Осы есептерді шешу үшін біз компьютер арқылы қазақтың дыбыстық жүйесін

зерттеп, дыбыстардың түрлері мен қасиеттерін талдадық. Онда дауысты дыбыстардың

математикалық моделдерін құру арқылы дауысты фонемалар мен олардың аллафондары

арасындағы мына қатынастар а+е=ә, о+е=ө, ұ+е=ү, ы+е=і бар екендігі дәлелденді (6.1-

Қосымшада Қазақ тілінің дауысты дыбыстар жүйесінің математикалық моделі, 6.2-

Қосымшада. Қазақ тілінің дауысты дыбыстар осциллограммасы). Бұл қатынастар жіңішке

даустыларды таңбалау үшін диграфтарды (екі әріптің тіркесін) қолдануға болатындығын

көрсетеді. Осындай әдіс басқа тілдерде қолданылады. Мысалы, ағылшын тілінде ш

дыбысы латын әліпбиінің s және h әріптерінің тіркесі арқылы белгіленген.

Сонымен қатар, біз құрамында қолданыстағы әліпбидің 100 миллион әріптері бар

қазақ тілінің мәтіндік корпусын құрып, ондағы әріптердің және олардың әртүрлі

тіркестерінің кездесу жиіліктерін компьютерлік программалар арқылы зерттедік (7-

қосымшада 100 000 000 әріптері бар қазақ тілінің мәтіндік корпусындағы әріптердің

кездесу жиілігі берілген).

Осы зерттеулер нәтижелері ұсынылатын әліпбиде қазақ тілінің қай дыбысын қандай

әріппен және қай дыбысты қандай әріпке қай таңбаны тіркеу арқылы тиімді (сөздің

жазуын ұзартпайтындай) етіп таңбалауді анықтауға қажет болды. Сондай-ақ, олар қазақ

тілінің жазуын жаңа әліпбиге көшірмес бұрын қолданыстағы әліпбиден алып

тасталынатын ё, и, ц, ч, щ, ь, ъ, э, ю, я әріптерінсіз қазақ тілінің жаңа орфографиялық

сөздігін жасауға көмектеседі.

Бас терезедегі «МӘТІНДЕР» деген сілтемені басқан кезде қазақ тіліндегі

мәтіндердің кириллицадағы және латиницадағы базасы ашылады, ол 13-суретте

көрсетілген.

13-Сурет.Аударылған мәтіндер тізімі.

Page 47: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

47

14-Суретте белгілі бір шығарманы таңдағаннан кейін, оның қазақ тіліндегі

мәтінінің беті кириллицада және латиницада көрсетіледі.

14-Сурет. Қазақ тілінің кириллицадан латиницаға аударылған мәтіні.

«Cөздік»деген батырманы басқанда латиницадағы көпсалалы қазақ терминдер

сөздігі ашылады, ол 15-суретте көрсетіледі.

15-сурет. Латиницадағы көпсалалы қазақ терминдер сөздігі.

Бірінші әріп бойынша іздеу қарастырылған.

Page 48: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

48

«Flash-роликтер» сілтемесін таңдағанда латиницадағы сөзді оқып білу үшін

анимациялық оқыту рөлігі бар бет ашылады, ол 16-суретте көрсетіледі.

16-Сурет.Анимациялық оқыту Flash-рөлігі.

«Электрондық оқу басылымы генераторы» сілтемесін басқан кезде электрондық оқу

басылымын (ЭОБ) латиницада тудыру технологиясымен танысуға, көшіруге және қарауға

мүмкіндік беретін бет пайда болады, ол 17-суретте көрсетілген.

17-Сурет. Латиницадағы электрондық оқу басылымының генераторы.

Page 49: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

49

Генератор көмегімен әрбір программалаушы емес оқытушы өзінің контентімен

оқыту элементтерінің құрамы және басқару құрылымы СТ ҚР 34.017-2005 «Ақпараттық

технологиялар. Электрондық басылым. Электрондық оқу басылымы» мемлекеттік

стандартына толық сәйкес бірегейлі интерфейсті ЭОБ дайындай алады.

Генератор 3 бөліктен тұрады:

- авторлық ішжүйесі;

- пайдаланушы ішжүйесі;

- бақылаушы ішжүйесі.

1. Локалды ЭОБ-ның авторлық ішжүйесі.

Авторлық ішжүйесі оқытушы өздіген ЭОБ-н жинақтау үшін арналған. Оқытушы

генераторға ЭОБ-ның тілі, тақырыбы, андатппасы және теория, мысалдар, тапсырмалар,

сұрақтар, тестілер, тезаурысы, анықтағышы сияқты міндетті деректерді және басқаларды

енгізуі тиіс. Генератордың кіріс-шығыс деректері 18-суретте көрсетілген.

18-сурет. Генератордың кіріс-шығыс деректері

Дайындалған ЭОБ генераторының ерекшелігіне мыналарды жатқызуға болады:

ЭОБ-ны қазақ тілінде дайындаған кезде оны кириллицада және латиницада

жинауға болады;

ЭОБ-ны жинақтау СТ ҚР 34.017-2005 «Ақпараттық технологиялар. Электрондық

басылым. Электрондық оқу басылымы»мемлекеттік стандартына сәйкес жүргізіледі;

ЭОБ-ның құрылымы иерархиялық: модулдер, блоктар, сабақтар;

келесі теория, мысалдар, тапсырмалар, сұрақтар, тестілер, графика, аудио видео,

тезаурыс, анықтағыш оқыту элементтері ерекшелінген;

көптілді қолдау;

білімді бақылау ішжүйесінің болуы;

мультимедиялық мүмкіншіліктер;

жекеленген оқыту траекториясы;

оқушы әрекетін қадағалау;

Page 50: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

50

әкімшілеу;

деректерді енгізу максималды қарапайымдалған.

Программаны орнатқаннан кейін бас мәзірде «Генератор ЭОБ» тобы пайда болып,

онда төрт құлақша: «Тіркеу», «Анықтамалық», «Оқулық», «ЭОБ жинау» шығады. Бас

мәзір 19-суретте көрсетіледі.

19 - сурет. Бас мәзір.

Алғащқыда пайдаланушы программалық өнімде тіркелуі қажет. Ары қарай ЭОБ-н

дайындауға тікелей көшуге болады. Кез келген пән бойынша ЭОБ-н дайындау екі

кезеңнен тұрады: сабақ мазмұнын жинау, нәтижені қарау.

«Жинау» кезеңін таңдағанда ЭОБ жасау программалық қауыз іске қосылады, оның

бірінші терезесі тілді таңдауды ұсынады, ол 20-суретте көрсетілген.

20-сурет. Тілді таңдау.

21-суретте көрсетілген терезе бойынша ЭОБ-ның авторы туралы ақпарат, андатпасы,

атауы, мазмұны, сабақтар құрамы, қарау және сақтау шығады.

21-сурет. Ендіретін деректер пішімі.

Page 51: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

51

«Avtorlar»батырмасын бсқан кезде ЭОБ-ның авторлар тізімін жасайтын программа

жіберіледі, ол 22-суретте көрсетіледі.

22-сурет. ЭОБ-ның авторлар тізімі.

Фото суретті қосқан немесе өңдеген кезде жазба контексті мәзір арқылы фото сурет

тұсында тінтуірдің оң батырмасын басқан кезде қойылады. Авторлардың максималды

саны 5 (3 пән мамандары, 1 дизайнер, 1 программалаушы).

«Angdatpa»батырмасын басқанда 23-суретте көрсетілген htm-бетті ашады.

23-сурет. Андатпаны енгізу.

Андатпаны өңдеу үшін «Файл» пунктісіндегі «Qazaq tili» дегенді таңдау

керек.Ашылған мәтіндік редакторда ЭОБ-ның құрылымы, құрамы, шығару мақсатыжәне

басқалары қысқаша сипатталады. Мәтінді дайындағаннан кейін, сақтау керек.

«Taqyryby» батырмасы ЭОБ-ның атауын енгізуге мүмкіндік береді, оның терезесі 24-

суретте көрсетілген.

24-сурет. ЭОБ-ның атауын енгізу.

«Mazmuny»батырмасы ЭОБ-ның үш деңгейлі модул, блок және сабақтан тұратын

құрылымын құрастыруға мүмкіндік береді. ЭОБ құрылымын құру терезесі 25-суретте

көрсетілген.

Page 52: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

52

25-сурет. ЭОБ құрылымын енгізу терезесі.

ЭОБ құрылымын құру біткеннен кейін, әрбір модулда барлық блоктардың, ал әрбір

блокта барлық сабақтардың болуын мұқият тексеру керек. «Sabaq quramy» батырмасы

сабақтың мазмұнын құрастыруға мүмкіндік береді. Сабақ құрамында «Teorijae»,

«Mysaly», «Tapsyrma», «Suraq», «Testiler», «Mueltijmedija», «Anyqtama», «Tezawrues»

(«Тезаурус») болады. Сабақтың мазмұнын ендіру терезесі 26-суретте көрсетілген.

26-сурет. Сабақтың мазмұнын ендіру терезесі.

Page 53: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

53

«Teorijae» батырмасы 27-суретте көрсетілген сабақтың теориялық материалын енгізу

терезесі ашады.

27-сурет.Сабақтың теориялық материалын енгізу терезесі.

Мәтінді өңдеу үшін мәзірдің «Oengdew» батырмасын басқанда мәтіндік редактор

ашылады. Қажетті ақпаратты енгізгеннен кейін өңделген мәтінді көру

үшін«Zhangalaw»батырмасын басу керек.

Мысалдарды, тапсырмаларды, сұрақтарды енгізу теориялық материалды енгізімен

бірдей.

«Testiler» батырмасын басқанда 28-суретте көрсетілген тестілерді енгізу терезесі

ашылады.

28-сурет. Тестілерді енгізу терезесі.

Page 54: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

54

«Mueltijmedija» батырмасы әрбір сабаққа анимация файлын *.exе кеңейтуімен қосуға

мүмкіндік береді.

«Anyqtama» батырмасы оқу материалына анықтамалық ақпаратты енгізу үшін

арналған, оның тезесі 29-суретте көрсетілген.

29-сурет. Анықтаманы енгізу терезесі.

«Tezawrus» батырмасы басқанда ЭОБ-на қатысты тезаурусты енгізуге мүмкіндік

беретін 30-суретте көрсетілген тезаурусты енгізу тересін ашады.

30-сурет. Тезаурусты енгізу терезесі.

«Qaraw» батырмасы барлық енгізген деректерді, оқушыға қандай түрде көрсетіледі,

сондай түрде көрсетеді.Бұл терезе 31-суретте көрсетілген.

Page 55: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

55

31-сурет. Енгізілген деректерді тексеру терезесі.

Деректер базасындағы ақпаратты және сабақты өңдеу аяқталғаннан кейін, міндетті

түрде«Saqtaw»батырмасын басу керек. Сонда 32-суретте көрсетілген ЭОБ-ның құралғаны

туралы шешім қабылдау терезесі ашылады. Егер Сіз ЭОБ-ның құрастырылғанына сенімді

болсаңыз, «Jea» батырмасын басыңыз.

32-сурет. ЭОБ-ның құралғаны туралы шешім қабылдау терезесі.

2. Локалды ЭОБ генераторының пайдаланушы жүйесі.

Енді мәзірдегі «Oqulyq» дегенді таңдап, дайын ЭОБ-н қарауға болады. Қазақ тілі

бойынша латиницада дайындалған электрондық оқу басылымының сипаттамасы осы

жұмыстың 2-ші бөлімінде берілген.

Page 56: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

56

3. Локалды ЭОБ генераторының бақылау жүйесі.

Дайын ЭОБ-н басқа компьютерге орнату үшін C:\Program Files\Generator4

директориясына AutoRun.exe файлын жүргізіп жіберу керек. 33-суретте программаны

орнату терезесі көрсетілген.

33-сурет. Программаны орнату терезесі.

Программа орнатылғаннан кейін «Elektroendi oquw basylymy»деген топ құрылады,

онда «Tirkew», «Aekimshilew» деген бөліктері бар. Программаны орнату терезесі 34-

суретте көрсетілген.

34-сурет. Программаны орнату.

«Aekimshilew» бөлімін таңдағанда 35-суретте көрсетілген құпия сөзді ендіру терезесі

ашылады.

35-сурет. Құпия сөзді енгізу терезесі.

Ең алғаш «12» деген құпия сөзін енгізіңіз. Құпия сөз енгізілгеннен кейін 36-суретте

көрсетілген әкімшілеу терезесі ашылады.

Page 57: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

57

36-сурет. Әкімшілеу терезесі.

Бұл терезеде оқушылар тізімін, олардың үлгерімін қарауға және деректер базасынан

оқушының аты-жөнін өшіруге және құпия сөзді өзгертуге мүмкіндік береді.

Page 58: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

58

ҚОРЫТЫНДЫ

ҒЗЖ-ның нәтижелердің қысқаша қорытындысы ретінде олардың мынадай

ықпалдарын келтіруге болады:

1. Ғылыми ықпалы. Қазақ тілінің әртүрлі аспектілерінің іргелі бейнеленуінің

дамуына, жазба және ауызша сөйлеуді тану мен құруға, бір тілден екінші тілге аударуға,

мәтіндердің мәндерінің интерпретациясына және басқаларына байланысты.

2. Экономикалық ықпал. Латын графикасындағы қазақ тілін ақпараттық

технологияларда қолдану қаріптер мен программа-драйверлерді, деректерді сұрыптау,

іздеу және тану программаларын дайындауға байланысты шығындарды азайтады.

3. Әлеуметтік ықпал. Қазақ тілінде ақпараттық технологияларды қолдану

арқылы адамдардың бір-бірімен ешқандай қиындықсыз қазақша жазбамен хабарласу

мүмкіншілігінің артуымен айқындалады.

ҒЗЖ-ның нәтижелерін нақты пайдалану бойынша нұсқаулар және алғышарттарға

мыналар жатады:

1. Алынған ғылыми нәтижелердің жарамдылығы қазақ тілінің жаңа латын әліпбиі,

латиницадағы жаңа орфографиялық нормалар, қайта жасалынатын морфологиялық

ережелер, қазақ тілі грамматикасы ережелерінің математикалық моделдері, жазбаша және

ауызша қазақ сөйлеулерін тану және тудыру әдістері мен алгоритмдері қазақ тіліндегі

сөйлеу технологияларын жасауға мүмкіндік береді және ғылым, техника және

технологияның түрлі салаларында пайдалану.

2. Зерттеу нәтижесінің мақсатты пайдаланушылары білім беру ордалары (орта

мектептер, колледждер, ЖОО және т.б.), мемлекеттік және мемлекеттік емес ұйымдар,

мемлекеттік басқару органдары, халықаралық ұйымдар және т.б. болады.

3. Алынған нәтижелер қазақ тілін компьютерлендіру мәселесінің кешенді және

тиімді шешімі болады.

4. Әлеуетті пайдаланушылар, ғалымдар бірлестігі және кең қауым арасында жұмыс

нәтижесін тарату ашық баспалардағы жарияланымдар, ғылыми, оқулық және танымал

әдебиеттер негізінде жүргізіледі.

Жобада қолданылатын зерттеу әдістері оның қойылған міндеттерді толық жүзеге

асыруға мүмкіндік береді. Қазіргі ғылым көзқарасына сәйкес осы тәсілдер қойылған

міндеттерді шешу үшін ең тиімді болып табылады және сенімді нәтижелер береді.

Жобаның сәтті жүзеге асырылмауына жеткілікті және өз уақытында қаржыландырылмау

сынды жағдайлар әсер етуі мүмкін. Бұл жағдай жобадан тыс және бар құралдар мен

ресурстардың көлемінде болжауға келмейді. Дегенмен, оның кері әсерін төмендететін,

Page 59: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

59

жобаны жүзеге асыратын альтернативті жолдарды табатындай да шараларды қарастыруға

болады. Мысалы, көрсетілген жағдай орын алса, біз жобаны жүзеге асыру үшін

орындаушылар қатысатын басқа жобалардың есебінен орындауға немесе жобаға басқа

қызығушылық танытқан заңды және жеке тұлғаларды жұмылдыруды ұсынамыз. Жобаны

орындау барысында зияткерлік шыншылдық және қатысушылардың келісімінсіз зерттеу

мәліметтерін бұзуға жол берілмейді. Жобаны жүзеге асыру барысында алынған жеке

нәтижелер осы жобаның сәйкес бөлімдеріне қатысатын зерттеу тобының

қатысушыларына тиісті зияткерлік меншік объектісі болып табылады.

Жобаны жүзеге асырғанда қазақ тілінің жаңа орфографиялық, орфоэпиялық,

морфологиялық, синтаксистік ережелерін жаңарту, оны компьютермен өңдейтін

технологияларды жасау және білім берудің барлық деңгейіне арналған оқу құралдарын

дайындау қажет.

Орындалған ҒЗЖ-ның ғылыми-техникалық деңгейі өте жоғары. Себебі, онда алғаш

рет қазақ тілі дауысты дыбыстарының математикалық моделі жасалынды, құрамында 100

млн. әріп бар мәтіндік корусты зерттеп, дыбыстардың және олардың тіркестерінің

жиіліктеріне негізделген қазақ дыбыстарын латын әріптерімен белгілеу әдістері құрылды,

қазақ орфографиясының ережелері тұрғызылды және т.б.

Қазақ тілінің жазуын латын графикасына аудару мен оның компьютерлік өңделуіне

байланысты есептердің толық шешімін (ғылыми, әдіснамалық, технологиялық және

әдістемелік негіздерін) бізден басқа ешкім ұсынған жоқ. Сондықтан да біз жобамызда

көрсетілген зерттеу саласында алынған нәтижелерге (талданым, әдістер, ережелер,

математикалық моделдер, алгоритмдер, компьютерлік программалар, деректер базасы)

байланысты жеткен ғылыми-техникалық деңгейді салыстыратын басқа ғылыми топтардың

жеткен жетістіктерін көрсете алмаймыз.

Енді қазіргі кирилл әліпбиіндегі қазақ мәтінін латын әріптеріне көшірмес бұрын,

оның ішіндегі қазақ тіліне жатпайтын барлық бөтен дыбыстарды белгілейтін әріптерден

арылуымыз керек, себебі ұсыналған әліпбиде оларды белгілейтін әріптер де ережелер де

жоқ. Олай болатыны, ешбір тілге басқа тілдің дыбыстарын заңдастырмай кіргізбейді және

басқа тілдің дыбыстарын қолданып жасалған сөздерді өзінің фонетикалық ережесіне

бағындырып сәйкес орфоэпия мен орфография емлелерін жасайды. Мысалы, орыс тілінде

қазақ тіліндегі кейбір адам есімдерін, жер және су аттарын қазақша жазбай, өзіне

түрлендіріп алады. Нәтижесінде Әділ=Адил, Іңкәр=Инкар, Ұзынағаш=Узунагач,

Іле=Или болды. Мұндай әдіс әліпбилері бөлек кезкелген тілдерде де қолданылады.

Сондықтан біз кирилл әліпбиіндегі қазақ сөздерінде кездесетін ё, и, э, ю, я , ц, ч, щ, ь, ъ

Page 60: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

60

әріптерінен арылу ережелерін жасап, оларды программалық жүзеге асырып, конвертерді

дайындадық.

Жобаны жүзеге асырғанда қазақ тілінің латиницадағы морфологиялық, синтаксистік

ережелерінің анықталы, формалданып, қазақ тілін компьютермен өңдейтін

технологияларды жасалынады және білім берудің барлық деңгейіне арналған латын

әліпбиіне негізделген жаңа әліпбиіндегі қазақ тілі бойынша электронды оқу құралдарын

дайындауға мүмкіндік береді.

Орындалған ҒЗЖ-ның ғылыми-техникалық деңгейі өте жоғары. Себебі, онда алғаш

рет Қазақша мәтіндерді кириллицадан латиницаға және керісінше аудару алгоритмі

әзірленіп, программалық жүзеге асты. Латиницадағы қазақ тілінің морфологиялық және

синтаксистік ережелері анықталды және формалданды.

Қазақ тілінің жазуын латын графикасына аудару мен оның компьютерлік өңделуіне

байланысты есептердің толық шешімін (ғылыми, әдіснамалық, технологиялық және

әдістемелік негіздерін) бізден басқа ешкім ұсынған жоқ.

Қазақ тілінің әліпбиін анықтағаннан кейін әрқайсысы 7 проблемадан тұратын мына 7

бағытта жұмыс жасалуы керек:

I. Қазақ тілін стандарттау:

1. Қазақ тілі фонетикасының стандарты.

2. Қазақ тілі орфграфиясының стандарты.

3. Қазақ тілі морфологиясының стандарты.

4. Қазақ тілі синтаксисінің стандарты.

5. Қазақ тілінде салалық терминдердің стандарты.

6.Қазақ тілінде аномастикалық және топономикалық стандарты.

7. Қазақ тілі бойынша білім деңгейінің стандарты.

II. Қазақ тілінің аудио сөздіктері:

1. Орфографиялық сөздік.

2. Орфоэпиялық аудио сөздік.

3. Фразеологиялық аудио сөздік.

4. Синонимдік аудио сөздік.

5. Жалпы тілдік қазақша-орысша-ағылшынша аудио сөздік.

6. Көпсалалық терминдердің қазақша-орысша-ағылшынша аудио сөздігі.

7. Көпсалалық терминдердің қазақша-орысша-ағылшынша түсіндірме аудио сөздігі.

III. Қазақ тілінің ережелерін формалдау:

1.Қазақ тілінің фонетикалық ережелерінің математикалық моделін жасау.

2.Қазақ тілінің морфологиялық ережелерінің математикалық моделін жасау.

Page 61: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

61

3.Қазақ тілінің синтаксистік ережелерінің математикалық моделін жасау.

4.Қазақ тіліндегі сөзпішіндерінің семантикалық моделін құру.

5.Қазақ тіліндегі сөзтіркестердің семантикалық моделін құру.

6.Қазақ тіліндегі сөйлемдердің семантикалық моделін құру.

7.Қазақ тіліндегі мәтіндердің семантикалық моделін құру.

IV. Қазақ тілі жазуын компьютерлік өңдеу:

1.Қазақ тілі мәтіндерін бір стандартты кодтан екінші стандартты кодқа екі жақты

аударатын конвертер жасау.

2.Қазақ тілі мәтіндерін бір графикадан екінші графикаға екі жақты аударатын

конвертер жасау.

3.Қазақ тілінің араб, кирилл, латын әріптеріндегі мәтіндерінің тематикалық

электрондық қорын құру.

4.Қазақ тілінің жаңа орфографиялық емлеге негізделген мәтіндік корпусын құру.

5.Қазақ тіліндегі жазбаша сөздерді талдау мен тудыруды автоматтандыратын

программаларын жасау.

6.Қазақ тіліндегі жазбаша сөзтіркестермен талдау мен тудыруды автоматтандыратын

программаларын жасау.

7.Қазақ тіліндегі жазбаша сөзтіркестермен талдау мен тудыруды автоматтандыратын

программаларын жасау.

V. Қазақ тілінің сөйлеу технологиясын жасау:

1.Қазақ тілінің жаңа орфоэпиялық емлелеріне негізделген фонетикалық толық аудио

корпусы.

2.Фонетикалық толық және семантикалық ақпараттары бар сөзпішіндер мен оларды

транскрипцияның генераторы.

3.Қазақ тілінің ауызша жеке сөздерін тудыру программасы.

4.Қазақша үзбей сөйлеулерін тудыру программасы.

5.Қазақ тілінің жеке ауызша сөздерін тану программасы.

6.Қазақша үзбей сөйлеулерін тудыру программасы.

7.Шуылдан тазарту және дикторларды тану программасы.

VI. Қазақ тілін электрондық оқыту (e-learning):

1.Қазақ тіліндегі дыбыстар, буындар және жеке сөздерді айту мен жазуды оқытатын

мультимедиалық дестелер.

2.Қазақ тіліндегі сөйлемдерді айту мен жазуды оқытатын мультимедиалық дестелер.

3.Әртүрлі жағдаятта (тұрмыста, жұмыста, сапарда) диалог жасап қазақша оқытатын

зерделі веб-жүйелер.

Page 62: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

62

4.Қазақ тілінде іс жүргізу оқытатын мультимедиалық веб-жүйе.

5.Қазақ тілінде азаматтық кодекс негіздерін оқытатын мультимедиалық веб-жүйе.

6.Мемлекеттік қызметкерлерге қазақ тілін оқыту үшін веб-жүйе.

7.Қазақ тілінде білім веб-портал.

VII. Қазақ тілі бойынша білім деңгейін сертификаттайтын зерделі жүйе:

1.Алғашқы деңгейін анықтайтын зерделі жүйе.

2.Қарапайым деңгейін анықтайтын зерделі жүйе.

3.Базалық деңгейін анықтайтын зерделі жүйе.

4.Орташа деңгейін анықтайтын зерделі жүйе.

5.Жақсы деңгейін анықтайтын зерделі жүйе.

6.Жоғарғы деңгейін анықтайтын зерделі жүйе.

7.Еркін меңгеру деңгейін анықтайтын зерделі жүйе.

Page 63: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

63

ҚОЛДАНЫЛҒАН ӘДЕБИЕТТЕР

1 Қазақ әліпбиін латын қарпіне көшірудің өзекті мәселелері: респуб.ғылыми-

практ.конф.материалдарының жинағы. – Астана: Сарыарқа баспасы, 2013. – 160б.

2 Қазақстан Республикасының Президенті – Елбасы Н.Ә. Назарбаевтың Қазақстан

халқына жолдауы. «Қазақстан-2050» стратегиясы.

3 Шәріпбай А.Ә. Қазақ жазуын латын әліпбиіне көшіру жобасы. Астана, 2013.–29б.

4 Шарипбай А.А., Омарбекова А.С. Конвертация текста на казахском языке с

кириллицы на латиницу. Труды І международной конференции "Компьютерная обработка

тюркских языков".-Астана, 2013. – с.115-121.

5 А.Ә. Шәріпбай. Қазақ жазуын латын әліпбиіне ауыстыру негіздемесі. – Астана:

Л.НГумилев атындағы ЕҰУ, 2014. – 43 б.

6 Sharipbay A.A., Anuarbekov K. Conversion of kazakh writing into latin alphabet

project. Труды I международной конференции "Компьютерная обработка тюркских

языков".-Астана, 2013. – с.121-140.

7 Gruber T.R.: Toward Principles for the Design Of Ontologies Used for Knowledge

Sharing. International Journal Human-Computer Studies Vol. 43, Issues 5-6, p. 907-928, 1995

8 Berge C.C.: Graphs and Hypergraphs. Elsevier Science Ltd, 1985.

9 Vizing V.G.: About a coloring of intsidentor in the hypergraph. Ser. 1, с.40-45, 2007

10 Г.К. Хахалин. Прикладная онтология на языке гиперграфов // материалы II

Всероссийской конференций «Знания-Онтологии-Теории» (ЗОНТ-09). Новосибирск. –

2009. - с. 223-231.

11 Қазақ грамматикасы. Фонетика, сөзжасам, морфология, синтаксис// Астана-2002.,

- с. 20-25.

12 http://protege.stanford.edu

13 И.А. Починский. Формальное представление семантических гиперграфов и

операций над ними // http://rgu-penza.ru/mni/content/files/2012_Pochinskii.pdf.

14 Шәріпбаев А.Ә., Бөрібаева А. Қазақ тілінің морфологиялық ережелерін

схемотехникалық моделдеу //Л.Н.Гумилев атындағы ЕҰУ Хабаршысы. – Астана, 2010.

– № 2. –б.73-79.

15 Шәріпбаев А.Ә., Бөрібаева А. Verilog тілінде қазақ сөздерінің морфологиялық

синтезін автоматтандыратын программа құру // Л.Н.Гумилев атындағы ЕҰУ Хабаршысы.

– Астана, 2010. – № 4. – б.182-187.

16 Шәріпбаев А.Ә., Бөрібаева А. Қазақ сөздерінің морфологиялық синтезін Quartus

II ортасында аппараты жүзеге асыру //Л.Н.Гумилев атындағы ЕҰУ Хабаршысы. – Астана,

2010. – № 4. – б.197-203.

Page 64: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

64

17 Бекманова Г. Т. Некоторые подходы к проблемам автоматического

словоизменения и морфологического анализа в казахском языке // Вестник Восточно-

Казахстанского государственного технического университета им. Д. Серикбаева. – Усть-

Каменогорск, 2009. – с. 192-197.

18 Добрушина Е.Р., Савина Г.Б., Гельбух А.Ф. Система точного морфологического

анализа и синтеза. Программное обеспечение новой информационной технологии. −

Калинин, 1989. –222с.

19 Б.Ш.Разахова, Қазақ тіліндегі сөз тіркестері мен сөйлемдерді құру және талдауды

автоматтандыру.// Дисс.: т.ғ.к. - 05.13.11 – Есептеуіш машиналар мен кешендердің және

компьютерлік жүйелердің математикалық және программалық қамтамасы, Астана,2009.

20 Мэтью Хорриддж, Практический справочник по построению Онтологий OWL в

Protege 4 и CO-ODE Tools Edition 1.2. -Манчестерский университет.

21 Д.И.Муромцев, Онтологический инжиниринг знаний в системе Protégé-. СПб.:

Питер, 2007.-62 c.

Page 65: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

65

ҚОСЫМША А

Жарияланған жұмыстар тізімі

2015

1. Sharipbay A.A., Buribayeva A. K. Kazakh Vowel Recognition at the Beginning of Words.

Mediterranean Journal of Social Sciences Volume 6, Issue 2S4, 2015, Pages 121-128, ISSN:

20399340. SCOPUS

2. Sharipbay A.A., Barlybayev A. An Intelligent System for Learning, Controlling and

Assessment .INFORMATION, 18 (5(A)). ISSN: 1343-4500. – Japan, 2015. P.1817-1828.

SCOPUS.

3. Омарбекова А.С., Закирова А.Б., Турсумбаева А.Ф., Садвакасова К.Ж. Методология

разработки портала электронных учебных изданий. Вестник КазНПУ. г.Алматы, 2015.-

№1.-С.203-208.

4. Sharipbay A.A., Zhetkenbay L., Bekmanova G., Kamanur U. The ontological model of noun

for Kazakh-turkish machine translation system . Proceedings of the international conference

“Turkic languages processing”, TurkLang 2015, September 17-19, 2015, Kazan, Tatarstan,

Russia, ISBN 978-59690-0262-3, -c. 15

5. Шарипбай А.А. Пути развития искусственного интеллекта в Казахстане. Материалы V

международной научно-технической конференции "Открытые семантические технологии

проектирования интеллектуальных систем OSTIS-2015", 2015, стр. 161-164

6. Муканова А. Асқарова С. Қазақ тілі бойынша интеллектуалды анықтамалық жүйенің

білімдер базасы. Л.Н.Гумилев атындағы ЕҰУ.- Астана: 2015. -С. 165-169.

7. Zhanat Sergazievna Saukhanova, Magripa Sergazievna Saukhanova & Omarbekova Assel

Sailaubekovna. Embedding RаpidMiner models in Java code.

Modern Applied Science. SCOPUS. Принято к публикации

8. Sharipbay A.A., Bekmanova G.T., Jetkenbay L. Semantic Neural Network Model of the

Morphological Rules of the Kazakh and Turkish Noun for NLP System. 2nd International

Conference on Computer, Control and Communication Technologies (CCCT'15). Dec. 3-4, 2015

Antalya, Turkey. Принято к публикации

9. Sharipbay A.A., Bekmanova G.T., Omarbekova A.S., Razakhova B.Sh., Turebayeva R.D.

Ontological Model of Educational Programs in Computer Science(Bachelor and Master

Degrees). 2nd International Conference on Computer, Control and Communication Technologies

(CCCT'15). Dec. 3-4, 2015 Antalya, Turkey. Принято к публикации

Page 66: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

66

2014

1 B.Yergesh, А. Mukanova, A. Sharipbay, G. Bekmanova, B.Razakhova. Semantic Hyper-

graph Based Representation of Nouns in the Kazakh Language // Computación y Sistemas Vol.

18, No.3, 2014 pp. 627–635. ISSN 1405-5546. DOI: 10.13053/CyS-18-3-2041. Thomson

Reuters.

2 Sharipbay A.A., Omarbekova A.S., Zakirova A.B Frame concept for generator of electronic

educational Publications. Advances in Intelligent Systems and Computing. Soft Computing in

Machine Learning. Volume 273, 2014, pp 11-20. Из базы SCOPUS.

3 Turmaganbetova Sh., Sharipbay A.A. Omarbekova A.S., The creating ontological model of

the tax systems in Kazakhstan. Advances in Intelligent Systems and Computing. Soft Computing

in Intelligent Control. Volume 272, 2014, pp 63-67. Из базы SCOPUS.

4 Omarbekova A.S., Zakirova A., Abduraimova B., Kantureeva M. Application of Olap-Cubes

by Monitoring Realization of University Strategy. Journal of Engineering and Applied Sciences,

Volume: 9, Issue: 10 P: 360-367. 2014/ DOI: 10.3923/jeasci.2014.360.367. Из базы SCOPUS

5 Sharipbay A.A., Omarbekova A.S., Seifullina A., Zakirova A.B Creating Intelligent

Electronic Textbooks based on Knowledge Management/ Lecture Notes in Engineering and

Computer Science. The World Congress on Engineering 2014 (WCE 2014). Volume 1, 2014,

P.224-227. Из базы SCOPUS

6 Шарипбаев А.А., Голенков В.В., Разахова Б.Ш.,Кабенов Д.И. Онтология негізінде

мәтінді табиғи тілде талдау. Хабаршы. - Астана: Л.Н.Гумилев ат. ЕҰУ, 2014.№2(99) -

Б.94-100.

7 Муканова А.С., А.Ә. Шәріпбай, Г.Т. Бекманова. Қазақ тілі сын есімінің формалды

моделі/Вестник.ЕНУ.- Астана: ЕНУ, 2014.-С. 114-119.

8 A.Mukanova, B.Yergesh, A. Sharipbay, G.Bekmanova. Formal Model of Adjective In the

Kazakh Language // Proceedings of the II International Conference on Computer processing

of Turkic Languages // Istanbul: Istanbul Technical University, 2014- p.57-61.

9 A. Buribayeva A. Sharipbay. The advantage of Interphoneme Processing at Diphone

Recognition of Kazakh Words // Istanbul: Istanbul Technical University, 2014- p.75-78.

10 L.Zhetkenbay, A.A.Sharipbay, G.T.Bekmanova, M.Khabylashimuly, U.Kamanur. The

Semantical, Ontological Models and Formalization Rules Kazakh Compound Words // Istanbul:

Istanbul Technical University, 2014- p.107-111.

11 A. Sharipbay, G.Bekmanova, B.Yergesh, A.Mukanova. Synchronized Linear Tree for

Morphological Analysis and Generation of the Kazakh Language // Istanbul: Istanbul Technical

University, 2014- p.113-117.

12 Б.Ж.Ергеш, А.С.Муканова, Г.Т. Бекманова, А.А. Шарипбай. Формальная модель

Page 67: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

67

именных частей речи казахского языка // 14-ая Национальная конференция по

искусственному интеллекту с международным участием (КИИ-2014): труды конференции.

– Казань: Изд-во РИЦ «Школа», 2014. –С. 101-107.

13 Қазақ жазуын латын әліпбиіне көшіру барысында қажетті орфографиялық сөздік:

сөздік / авт. А.Ә. Шәріпбай. – Астана: Л.НГумилев атындағы ЕҰУ, 2014. – 87 б.

14 А.Ә. Шәріпбай. Қазақ жазуын латын әліпбиіне ауыстыру негіздемесі. – Астана:

Л.НГумилев атындағы ЕҰУ, 2014. – 43 б.

15 Sharipbay A., Bekmanova G., Mukanova A.Yergesh B. Ontological representation of the

kazakh language noun // Proc. 2nd international scientific and practical conference “Intellectual

information and communication technologies as a tool for realization of the third industrial

revolution within the framework of the Kazakhstan-2050 strategy”.-Astana, 2014.-P.242-246.

16 A. Sharipbay, A.Mukanova. Smart question answering system for e-government web-portal //

Proceedings of the International Scientific- Practical Conference «Smart government: Science

and Technology».-Astana, 2014. - P. 200-204.

17 A. Sharipbayev, B. Karimzhan, B. Razakhova. Smart System for Analysis and Synthesis of

the Kazakh Sentences. Proceedings of the International Scientific-Practical Conference «Smart

Government: Science and Technology. October 7-8, 2014. P. 71-75.

2013

1 Sharipbay A.A., Omarbekova A.S., Zakirova A.B. Frame concept for generator of electronic

educational Publications. The 14th International Symposium on Advanced Intelligent Systems

(ISIS2013). November 13 – 16, 2013/Daeieon, Korea.

2 Жакупов Ж.А. Қазақ жазуын латын әрпіне көшіруге байланысты пікірлер.// Қазақ

филологиясы туралы халықаралық ғылыми конф. мат. – Минзу университеті, Қытай, 2013.

3 Sharipbay A. Problems and prospects of computer processing of the kazakh language //

Proceedings of the I International Conference on Computer processing of Turkic Languages /

Astana: L.N.Gumilyov Eurasain National University, 2013- p.13-17.

4 Sharipbay A., Anuarbekov K. Conversion of kazakh writing into latin alphabet (project) //

Түркі тілдерін компьютерлік өңдеу: халықаралық конференция еңбектері. – Астана:

Л.Н.Гумилев атындағы ЕҰУ баспасы, 2013. – Б.121-140.

5 Байбеков С. Қазақ алфавитін латын-ағылшын графикасына көшіру жобасы //// Қазақ

әліпбиін латын қарпіне көшірудің өзекті мәселелері: респуб.ғылыми-практик.конф. матер.

– Астана, 2013. – Б. 23-35.

6 Байбеков С.Н. Қазақ алфавитінің латын-ағылшын графикасындағы жаңа жобасы //

Түркі тілдерін компьютерлік өңдеу: халықаралық конференция еңбектері. – Астана:

Л.Н.Гумилев атындағы ЕҰУ баспасы, 2013. – Б.75-81.

Page 68: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

68

7 Байбеков С.Н. Қазақ әліпбиін латын-ағылшын қарпіне көшіру жобасы // «Латын

әліпбиіне көшу: тәжірибе және ықпалдастық» атты халықаралық ғылыми-тәжірибелік

конференциясы. – Астана, 7-маусым, 2013

8 Есенбаев Ж.А., Карабалаева М.Х., Шамаева Ф.К. к вопросу об уточнении

фонетического строя казахского языка посредством акустического анализа звуков // Түркі

тілдерін компьютерлік өңдеу: халықаралық конференция еңбектері. – Астана:

Л.Н.Гумилев атындағы ЕҰУ баспасы, 2013. – Б.105-111.

9 Жакупов Ж.А. Әріп мәні әріде.// Қазақ әліпбиін латын қарпіне көшірудің өзекті

мәселелері: респуб. ғылыми-практикалық конф. мат. жинағы. – Астана: «Сарыарқа»

баспасы, 2013. – Б. 126 – 136.

10 Жакупов Ж.А. Әріп тілге бейімделсін.// «Орталық Қазақстан» газеті. – 2013, 6-сәуір.

11 Жакыпов Ж. Латын әліпбиіне көшудің лингвистикалық және ақпараттық негіздері //

Латын әліпбиіне көшу: тәжірибе және ықпалдастық» атты халықаралық ғылыми-

тәжірибелік конференциясы. – Астана, 7-маусым, 2013.

12 Жақыпов Ж.А. Қазақ жазуын латындандырудың феноменологиялық мәселесі // Түркі

тілдерін компьютерлік өңдеу: халықаралық конференция еңбектері. – Астана:

Л.Н.Гумилев атындағы ЕҰУ баспасы, 2013. – Б.111-115.

13 Жүнісбек Ә. Жазу реформасы // Қазақ әліпбиін латын қарпіне көшірудің өзекті

мәселелері: респуб.ғылыми-практик.конф. матер. – Астана, 2013. – Б. 36-48.

14 Жүнісбек Ә. Кірме (бүлдіргі) кирилл таңбаларының дыбыс талданымы // Түркі тілдерін

компьютерлік өңдеу: халықаралық конференция еңбектері. – Астана: Л.Н.Гумилев

атындағы ЕҰУ баспасы, 2013. – Б. 90-94.

15 Жүнісбек Ә. Түркі халықтарына арналған ортақ әліпби идеясы // «Түркі елдерінде

латын графикасы негізіндегі жаңа ұлттық әліпби енгізу тәжірибесі: проблемалар және

оларды шешу жолдары» атты дөңгелек үстел. – Астана, 16 мамыр, 2013.

16 Қамзабекұлы Д. Білімпаздардың тұңғыш сиезі және латын қарпі // «Латын әліпбиіне

көшу: тәжірибе және ықпалдастық» атты халықаралық ғылыми-тәжірибелік

конференциясы. – Астана, 7-маусым, 2013.

17 Құрманбайұлы Ш. Латын әліпбиі: лингвистикалық және ақпараттық технологиялық

мәселелер // Қазақ әліпбиін латын қарпіне көшірудің өзекті мәселелері: респуб.ғылыми-

практик.конф. матер. – Астана, 2013. – Б. 5-15.

18 Омарбекова А.С., Шарипбай А.А. Технология создания электронных учебных изданий

на латинице. Труды I международной конференции "Компьютерная обработка тюркских

языков".- Астана, 2013. – с.336-342

Page 69: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

69

19 Шарипбай А.А., Омарбекова А.С. Конвертация текста на казахском языке с кириллицы

на латиницу // Компьютерная обработка тюркских языков: труды междунар. конф. –

Астана: ЕНУ им. Л.Н. Гумилева, 2013. – С.115-121.

20 Шәріп А. Нәзір Төреқұлов және жаңа әліпби тұжырымдамасы // «Латын әліпбиіне

көшу: тәжірибе және ықпалдастық» атты халықаралық ғылыми-тәжірибелік

конференциясы. – Астана, 7-маусым, 2013.

21 Шәріпбай А. Қазақ жазуын латын әліпбиіне көшіру жобасы // «Латын әліпбиіне көшу:

тәжірибе және ықпалдастық» атты халықаралық ғылыми-тәжірибелік конференциясы. –

Астана, 7-маусым, 2013.

22 Шәріпбай А. Қазақ жазуын латын әліпбиіне көшіруге ұсыныстары // Қазақ әліпбиін

латын қарпіне көшірудің өзекті мәселелері: респуб.ғылыми-практик.конф. матер. –

Астана, 2013. – Б. 48-62

23 Шәріпбай А.Ә. Қазақ жазуын латын әліпбиіне көшіру жобасы. Астана, 2013.–29б.

24 Шәріпбай А.Ә. Қазақ жазуын латын әліпбиіне көшірудің ғылыми, технологиялық және

методикалық негіздері // «Қазақстан-2050: стратегиясы және латын әліпбиіне көшу үрдісі»

атты халықаралық ғылыми-практикалық симпозиум. – Алматы. 6-8 маусым 2013.

25 Шәріпбай А.Ә. Қазақ тіліне кірме терминдерді латын графикасымен таңбалау

алдындағы өтпелі ережелер // ҚР Мәдениет және ақпарат министрлігі Тіл комитеті

өткізген «Кірме терминдерді латын графикасымен таңбалау мәселелері» атты

республикалық дөңгелек үстелі. – Астана, 29-қазан, 2013.

Page 70: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

70

ҚОСЫМША Б

Қазақ тіліндегі мәтіндерді кириллицадан латиницаға аударатын конвертердің

программалық коды

Index.php

<?

session_start();

Error_Reporting(E_ALL & ~E_NOTICE);

setcookie("freshcoder","count",time()+600);

$host = "localhost";

$user = "root";

mysql_connect($host, $user, $password);

mysql_select_db("konverter");

$poisk=$_POST[poisk];

function but($target, $image, $alt)

{

echo "<a href=\"$target\"><img src=\"images/$image".".png\"

alt=\"$alt\" border=0 </a></center>";

}

?>

<html>

<head>

<title>

Конвертер</title>

<style>

.menu1 {color:white; font-size:20pt;text-align:center;font-weight:bold}

.menu2 {color:white; font-size:14pt;text-align:center}

.b {color:"navy"; font-size:12pt; text-align:center;

font-family:times,arial,sans-serif; font-weight:}

h1 {color:navy; font-size:20pt; text-align:center;

font-family:sans-serif, times,arial}

h2 {color:"#CCFFFF"; font-size:10pt; text-align:center;

font-family:times,Comic Sans MS,arial,sans-serif}

h3 {color:maroon; font-size:14pt; text-align:center;

font-family:times,arial,sans-serif}

h4 {color:"black""; font-size:14pt; text-align:left;

Page 71: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

71

font-family:times,arial,sans-serif}

.b {color:navy; font-size:14pt; text-align:right;

font-family:times,arial,sans-serif; font-weight:}

</style>

<?echo "<form method = post action = \"index.php\">";?>

<table width = "100%" align=center border=0 bgcolor = "#3a6ea5">

<tr><td width =300 align=center>

<? echo "<b><a href='http://e-zerde.kz' target='_blank'>ЖАСАУШЫ</a>";?>

</td><td align=center>

<span class=menu1>&#1178аза&#1179

жазуынкириллицаданлатиница&#1171ааудару</span></td><td width =300 align=center>

<? echo "<b><a href='taldau.php' >ТАЛДАУ</a>";?>

</td></tr></table>

<br><table width = "100%" align=center border=0 ><tr>

<td width =50% align=center bgcolor = "#ccccff" >

<? echo "<a href=' doklad1.php'><b>&#1240ЛІПБИНЕГІЗДЕМЕСІ</a>";?>

</td><td width =300 bgcolor = "#ccccff" align=center>

<? echo "<a href=' orf.php'><b>&#1200СЫНЫЛАТЫНОРФОГРАФИЯ</a>

<a href=' orf2.php'><b> (&#1256&#1186ДЕУ</a> / <a href=' orf3.php'><b>&#1178ОСУ)

</a>"; ?>

</td></tr></table><br>

<table border=1 width = "100%" >

<tr align=center><td>a

</td><td>ae</td><td>b</td><td>c</td><td>d</td><td>e</td><td>f</td><td>g</td><td

>h</td><td>i</td><td>j</td><td>k</td><td>kh</td><td>l</td><td>m</td><td>n</td><td>o</

td> <td> oe</td> <td>p</td> <td> ph</td>

<td>q</td><td>r</td><td>s</td><td>t</td>

<td>u</td><td>w</td><td>x</td><td>y</td><td>z</td></tr>

<tr align=center><td>a</td><td>&#1241 </td>

<td>б</td><td>ш</td><td>д</td><td>е</td><td>&#1171</td><td>г</td><td>&#1187

</td><td>i</td><td>й</td><td>к</td><td>х</td><td>л</td><td>м</td><td>н</td><td>о</td>

<td> &#1257</td> <td>п</td> <td> ф</td>

<td>&#1179</td><td>р</td><td>с</td><td>т</td>

<td>&#1201</td><td>у</td><td>ж</td><td>ы</td><td>з</td></tr>

</table><br>

Page 72: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

72

<table width = "30%" align=center border=0 >

<tr><td align=center width = "25%" >

<? echo " <b> I-ші&#1241діс";?>

</td><td align=right bgcolor = "#ccccff" width = "5%" >

<b><a href='index1.php'>&#1178АРАУ</a></td><td></td>

<td align=center width = "25%" >

<? echo "<b> II-ші&#1241діс";?>

</td><td align=right bgcolor = "#ccccff" width = "5%" >

<b><a href='index2.php'>&#1178АРАУ</a></td></tr><tr>

<td colspan=2>

<table border=1 align=center width = "100%">

<tr align=center><td>bh</td><td>v</td></tr>

<tr align=center><td>в</td><td>&#1199</td></tr>

</table></td><td></td>

<td colspan=2><table border=1 align=center width = "100%">

<tr align=center><td>v</td><td>ue</td></tr>

<tr align=center><td>в</td><td>&#1199</td></tr>

</table></td></tr></table>

<br><table width = "100%" align=center border=0 bgcolor = "#3a6ea5">

<tr><td align=center width =200>

<span class=menu2>Жасаушы&#1171ааудару&#1171а&#1179атысты&#1201сыныс</span>

</td><td width =70>

<?echo "<textarea rows=1 cols=70 name=com value=$com></textarea>";?>

</td><td align=left width =70>

<input type = submit name='comm' value = ' ЖІБЕРУ '>

<td bgcolor = "#ccccff" align=center width =300>

<?$query = "select * from user ";

$result = mysql_query($query);

$user1 = mysql_result($result,0,"user");

if(!$_COOKIE['freshcoder'])

{

$user1++;

$query = "delete from user";

$result = mysql_query($query);

$query = "insert into user values('$user1')"; $result = mysql_query($query);

Page 73: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

73

}

echo "<b>Сайт&#1179акірушілерсаны: $user1";

?>

</td></tr></table>

<? if (isset($_POST['comm'])) {

$com=$_POST['com'];

$d=date('d.m.Y');

$query = "insert into comment values('','$d','$com','')";

$result = mysql_query($query);

$com="";

$query = "delete from comment where comment=''";

$result = mysql_query($query);

} ?>

<table width = "100%" align=center border=0>

<tr><td></td><td ><b>Комментариялар:</td><td ><b>Жауаптар:</td><td></td></tr>

<?$query= "select count(*) from comment";

$result= mysql_query($query);

$count1 = mysql_result($result, 0, 0 );

$query = "select * from comment order by id";

$result = mysql_query($query);

for ($i=0;$i<$count1;$i++)

{$ii=$i+1;

$row = mysql_result($result,$i,"comment");

$row1 = mysql_result($result,$i,"otvet");

$d = mysql_result($result,$i,"data");

if ($i%2==1)

{echo "<tr>";}

else

{echo "<tr bgcolor = #f2f2f2>"; }

echo " <td width=10> $ii. </td><td> $row </td><td> $row1 </td><td width=10> $d

</td></tr>" ;}?>

</table>

Index1.php

<?

session_start();

Page 74: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

74

Error_Reporting(E_ALL & ~E_NOTICE);

setcookie("freshcoder","count",time()+600);

$host = "localhost";

$user = "root";

mysql_connect($host, $user, $password);

mysql_select_db("konverter");

$poisk=$_POST[poisk];

function but($target, $image, $alt)

{ echo "<a href=\"$target\"><img src=\"images/$image".".png\"

alt=\"$alt\" border=0 </a></center>";}

?>

<html>

<head>

<title>

Конвертер</title>

<style>

.menu1 {color:white; font-size:20pt;text-align:center;font-weight:bold}

.menu2 {color:white; font-size:14pt;text-align:center}

.b {color:"navy"; font-size:12pt; text-align:center;

font-family:times,arial,sans-serif; font-weight:}

h1 {color:navy; font-size:20pt; text-align:center;

font-family:sans-serif, times,arial}

h2 {color:"#CCFFFF"; font-size:10pt; text-align:center;

font-family:times,Comic Sans MS,arial,sans-serif}

h3 {color:maroon; font-size:14pt; text-align:center;

font-family:times,arial,sans-serif}

h4 {color:"black""; font-size:14pt; text-align:left;

font-family:times,arial,sans-serif}

.b {color:navy; font-size:14pt; text-align:right;

font-family:times,arial,sans-serif; font-weight:}

</style>

<?

echo "<form method = post action = \"index1.php\">";

?>

<table width = "100%" align=center border=0 bgcolor = "#3a6ea5">

Page 75: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

75

<tr><td align=center>

<span class=menu1>&#1178аза&#1179

жазуынкириллицаданлатиница&#1171ааудару</span></td><td><span class=b><b><a

href='index.php'>АРТ&#1178А</a></span></td></tr></table> <br>

<table border=1 width = "100%" >

<tr align=center><td>a </td><td>ae </td> <td>b</td> <td>bh</td>

<td>c</td><td>d</td><td>e</td><td>f</td><td>g</td><td>h</td><td>i</td><td>j</td>

<td>k</td><td>kh</td><td>l</td><td>m</td><td>n</td><td>o</td> <td> oe</td>

<td>p</td> <td> ph</td> <td>q</td><td>r</td><td>s</td><td>t</td>

<td>u</td> <td>v</td> <td>w</td><td>x</td><td>y</td><td>z</td></tr>

<tr align=center><td>a</td><td>&#1241 </td> <td>б</td> <td>в</td>

<td>ш</td><td>д</td><td>е</td><td>&#1171</td><td>г</td><td>&#1187</td><td>i<

/td><td>й</td><td>к</td><td>х</td><td>л</td><td>м</td><td>н</td><td>о</td> <td>

&#1257</td> <td>п</td> <td> ф</td>

<td>&#1179</td><td>р</td><td>с</td><td>т</td> <td>&#1201</td>

<td>&#1199</td> <td>у</td><td>ж</td><td>ы</td><td>з</td></tr>

</table>

<br>

<table width = "100%" >

<tr><td align=center colspan=3><?

echo" <a href='podk.php'>Загрузитьфайл *.txt (Кодировка UTF-8).</a>";

?></td></tr>

<tr><td align=center>

<h3>&#1178олданыста&#1171ы&#1241ліпбидегіал&#1171аш&#1179ым&#1241тін:</h3>

<?

echo "<textarea rows=18 cols=40 name=poisk value=$poisk>$poisk</textarea>";

?>

</td><td align=center>

<h3>Тек&#1179аза&#1179 дыбыстарнегізіндегіаралы&#1179 м&#1241тін:</h3>

<textarea rows=18 cols=40 name=res>

<?

$str=$poisk;

$q1=array("африка","бактерия","баланс","балет","бальзам","банк","банкет","банкир","банк

нот","бизнес","биллинг","буфер","бюджет","бюллетень","видео","вьетнам","диагностика",

"дизъюнкция","дискрет","дисплей","дистрибутив","иллюстратор","иллюстрация

Page 76: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

76

","имитациялы&#1179;","императивті","импликант","импликация","иновация","институт",

"интеграл","кабина","кабинет","квадрант","квадрика","квазар","квакер","квант","квартимэ

йстер","кворум","комитет","коммуникация","компас","компьютер","компютер","конъюнк

ция","косинус","логарифм","максимум");

$q2=array("&#1241;фрік&#1241;","б&#1241;ктерій&#1241;","баланыс","б&#1241;лет","б&

#1241;лз&#1241;м","б&#1241;нк","б&#1241;нкет","б&#1241;нкір","б&#1241;нкін&#1257;т

","бізнес","біллінг","б&#1199;фір","б&#1199;йджет","б&#1199;ллетін","війде&#1257;","ві

йетн&#1241;м","дій&#1241;гн&#1257;стік","дізій&#1199;нксій&#1241;","діскірет","діспіл

ей","дістріб&#1199;тів","іл&#1199;стр&#1241;тір","іл&#1199;стр&#1241;тсій&#1241;","ім

іт&#1241;тсій&#1241;","імпер&#1241;тів","імпілік&#1241;нт","імпілік&#1241;сій&#1241;

","інноватсыйа","інстіт&#1199;т","інтегр&#1241;л","к&#1241;бін","к&#1241;бінет","куадр

ант","куадрыйк","куазар","ку&#1241;кер","к&#1199;&#1241;нт&#1199;м","куартермастер

","куор&#1201;м","к&#1257;мітет","к&#1257;мм&#1199;нікешін","к&#1257;мп&#1257;с",

"к&#1257;мп&#1199;тер","к&#1241;мп&#1199;йтір","к&#1241;ній&#1199;нксій&#1241;",

"к&#1257;сін&#1199;с","л&#1257;г&#1241;ріфім","м&#1241;ксім&#1199;м");

$str = str_replace($q1, $q2, $str);

$q1=array("милиция","минимум","министр","молекула","нью

йорк","объект","полиция","президент","премьер","проблема","республика","символ","сину

с","синхрон","субъект","теория","термин","терминал","техника","технология","университе

т","факультет","фонограмма","функция","хаос","харизма","чемпион","эволюция","эксгума

ция","экскаватор","экскурсия","экспансия","экспедиция","эксперимент","экспериментальд

ы","эксперт","эксплуататор","эксплуатация","экспонент","экспорт","экспресс","чемпион");

$q2=array("мілісій&#1241;","мінім&#1199;м","міністір","моле&#1179;&#1201;ла","неу

йорк","&#1257;бжект","полыйс","презідент","премійер","проблем","респ&#1199;блік","сы

ймбол","сін&#1199;с","сыйнхрон","с&#1199;бжект","те&#1257;рійа","термін","термін&#1

241;л","технік","текнологыйа","&#1199;ніверсітет","ф&#1241;к&#1199;лтет","фонограмма

","ф&#1201;нксыйа","хауос","к&#1241;рісім","шемпыйон","ев&#1257;л&#1199;тсій&#124

1;","ексг&#1199;м&#1241;тшін","екск&#1257;в&#1241;т&#1257;р","екск&#1199;ршін","ек

сп&#1241;ншін","експедішін","експерімент","експерімент&#1241;лді","експерт","експл&#

1257;йтер","експл&#1257;т&#1257;йшін","експ&#1257;нент","експорт","експресс","шемпі

й&#1257;н");

$str = str_replace($q1, $q2, $str);

$q1=array("ё","э","ц","ч","&#1211;","ъ");

$q2=array("e","е","с","ш","х","ый");

$str = str_replace($q1, $q2, $str);

Page 77: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

77

$q1=array("ае","ое","&#1201е");

$q2=array("айе","ойе","&#1201йе");

$str = str_replace($q1, $q2, $str);

for ($i=0;$i<strlen($str);$i++) //щ

{ if ($str{$i}=="щ") {

if (($str{$i+1}==" ") or ($str{$i-1}==" ") or ($i==0) or ($str{$i+1}==".") or ($str{$i+1}==","))

{ $str{$i}="ш";}

else

{$str{$i}="ш";

$w1=substr($str,0,$i+1);

$w2=substr($str,$i+1);

//echo "(w1= $w1)";echo "(w2= $w2)";

$str=$w1.'ш'.$w2;}}}

$q1=array("уу","УУ");

$q2=array("у","У");

$str = str_replace($q1, $q2, $str);

for ($i=0;$i<strlen($str);$i++) //ь

{ if (($str{$i}=="ь") or ($str{$i}=="Ь"))

{

if ($str{$i+1}=="е")

{$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=$w1."ій".$w2;

}

if ($str{$i+1}=="ю")

{

$w1=substr($str,0,$i);

$w2=substr($str,$i+2);

$str=$w1."&#1199й".$w2;

}

if

((($str{$i+1}=="б") or ($str{$i+1}=="Б") or

($str{$i+1}=="в") or ($str{$i+1}=="В") or

($str{$i+1}=="г") or ($str{$i+1}=="Г") or

($str{$i+1}=="з") or ($str{$i+1}=="З") or

Page 78: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

78

($str{$i+1}=="ж") or ($str{$i+1}=="Ж") or

($str{$i+1}=="д") or ($str{$i+1}=="Д") or

($str{$i+1}=="ф") or ($str{$i+1}=="Ф") or

($str{$i+1}=="к") or ($str{$i+1}=="К") or

($str{$i+1}=="л") or ($str{$i+1}=="Л") or

($str{$i+1}=="м") or ($str{$i+1}=="М") or

($str{$i+1}=="н") or ($str{$i+1}=="Н") or

($str{$i+1}=="п") or ($str{$i+1}=="П") or

($str{$i+1}=="р") or ($str{$i+1}=="Р") or

($str{$i+1}=="с") or ($str{$i+1}=="С") or

($str{$i+1}=="ц") or ($str{$i+1}=="Ц") or

($str{$i+1}=="т") or ($str{$i+1}=="Т") or

($str{$i+1}=="х") or ($str{$i+1}=="Х") or

($str{$i+1}=="ш") or ($str{$i+1}=="Ш") or

($str{$i+1}=="[") or ($str{$i+1}=="]") or

($str{$i+1}=="{") or ($str{$i+1}=="}")

and

(

($str{$i-1}=="б") or ($str{$i-1}=="Б") or

($str{$i-1}=="в") or ($str{$i-1}=="В") or

($str{$i-1}=="г") or ($str{$i-1}=="Г") or

($str{$i-1}=="з") or ($str{$i-1}=="З") or

($str{$i-1}=="ж") or ($str{$i-1}=="Ж") or

($str{$i-1}=="д") or ($str{$i-1}=="Д") or

($str{$i-1}=="ф") or ($str{$i-1}=="Ф") or

($str{$i-1}=="к") or ($str{$i-1}=="К") or

($str{$i-1}=="л") or ($str{$i-1}=="Л") or

($str{$i-1}=="м") or ($str{$i-1}=="М") or

($str{$i-1}=="н") or ($str{$i-1}=="Н") or

($str{$i-1}=="п") or ($str{$i-1}=="П") or

($str{$i-1}=="р") or ($str{$i-1}=="Р") or

($str{$i-1}=="с") or ($str{$i-1}=="С") or

($str{$i-1}=="ц") or ($str{$i-1}=="Ц") or

($str{$i-1}=="т") or ($str{$i-1}=="Т") or

($str{$i-1}=="х") or ($str{$i-1}=="Х") or

Page 79: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

79

($str{$i-1}=="ш") or ($str{$i-1}=="Ш") or

($str{$i-1}=="[") or ($str{$i-1}=="]") or

($str{$i-1}=="{") or ($str{$i-1}=="}")

))){

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=$w1.$w2;

}}}

for ($i=0;$i<strlen($str);$i++)

{ if ($str{$i}=="и")

{if (($str{$i-1}=="г") or ($str{$i-1}=="к") or ($str{$i-1}=="Г") or ($str{$i-1}=="К"))

{$str{$i}="і";

$w1=substr($str,0,$i+1);

$w2=substr($str,$i+1);

//echo "(w1= $w1)";echo "(w2= $w2)";

$str=($w1.'й'.$w2);

}}}

$q1=array("&#1199;","&#1198;","&#1241;","&#1240;","&#1257;","&#1256;","&#1201;","&#

1200;","&#1178;","&#1179;","&#1170;","&#1171;"); /////////////////////////

$q2=array("%","$","@","|","/","*","~","^","{","}","[","]");

$str = str_replace($q1, $q2, $str);

for ($i=0;$i<strlen($str);$i++)

{ if (($str{$i}=="я") or ($str{$i}=="Я") )

{$mm=0;

for ($j=0;$j<=10;$j++) //вправомяг

{ if (

(substr($str,$i+$j,1)=="@") or (substr($str,$i+$j,1)=="|") or

(substr($str,$i+$j,1)=="/") or (substr($str,$i+$j,1)=="*") or

(substr($str,$i+$j,1)=="%") or (substr($str,$i+$j,1)=="$") or

(substr($str,$i+$j,1)=="і") or (substr($str,$i+$j,1)=="І") or

(substr($str,$i+$j,1)=="е") or (substr($str,$i+$j,1)=="Е") or

(substr($str,$i+$j,1)=="г") or (substr($str,$i+$j,1)=="к") )

{

if ($mm==0) {$mm=2;}

}

Page 80: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

80

if (substr($str,$i+$j,1)==" ") {break;} }

for ($j=0;$j<=10;$j++)

{ if (

(substr($str,$i+$j,1)=="а") or (substr($str,$i+$j,1)=="о") or

(substr($str,$i+$j,1)=="ы") or

(substr($str,$i+$j,1)=="А") or (substr($str,$i+$j,1)=="О") or

(substr($str,$i+$j,1)=="Ы") or

(substr($str,$i+$j,1)=="~") or (substr($str,$i+$j,1)=="^") or

(substr($str,$i+$j,1)=="э") or

(substr($str,$i+$j,1)=="Э") or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{

if ($mm==0) {$mm=1;}

}

if (substr($str,$i+$j,1)==" ") {break;}

}

for ($j=0;$j<=10;$j++)

{

if (

(substr($str,$i-$j,1)=="@") or (substr($str,$i-$j,1)=="|") or

(substr($str,$i-$j,1)=="/") or (substr($str,$i-$j,1)=="*") or

(substr($str,$i-$j,1)=="%") or (substr($str,$i-$j,1)=="$") or

(substr($str,$i-$j,1)=="і") or (substr($str,$i-$j,1)=="І") or

(substr($str,$i-$j,1)=="е") or (substr($str,$i-$j,1)=="Е") or

(substr($str,$i+$j,1)=="г") or (substr($str,$i+$j,1)=="к") )

{

if ($mm==0) { $mm=2;}

}

if (substr($str,$i-$j,1)==" ") {break;} }

for ($j=0;$j<=10;$j++)

{

if (

(substr($str,$i-$j,1)=="а") or (substr($str,$i-$j,1)=="о") or (substr($str,$i-

$j,1)=="ы") or

Page 81: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

81

(substr($str,$i-$j,1)=="А") or (substr($str,$i-$j,1)=="О") or (substr($str,$i-

$j,1)=="Ы") or

(substr($str,$i-$j,1)=="^") or (substr($str,$i-$j,1)=="~") or (substr($str,$i-

$j,1)=="э") or

(substr($str,$i-$j,1)=="Э")or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{

if ($mm==0) {$mm=1; }

}

if (substr($str,$i-$j,1)==" ") {break; }

}

if ($mm==0) { //нет гласных - один слог

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=($w1.'йа'.$w2); }

if ($mm==1) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

//echo "($m w1= $w1)";echo "(w2= $w2)";

$str=($w1.'йа'.$w2);

}

if ($mm==2) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

//echo "($m w1= $w1)";echo "(w2= $w2)";

$str=($w1.'й@'.$w2);

}}}

for ($i=0;$i<strlen($str);$i++)

{

if (($str{$i}=="и") or ($str{$i}=="И") )

{$mm=0;

for ($j=0;$j<=10;$j++) //вправомяг

{

if (

(substr($str,$i+$j,1)=="@") or (substr($str,$i+$j,1)=="|") or

Page 82: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

82

(substr($str,$i+$j,1)=="/") or (substr($str,$i+$j,1)=="*") or

(substr($str,$i+$j,1)=="%") or (substr($str,$i+$j,1)=="$") or

(substr($str,$i+$j,1)=="і") or (substr($str,$i+$j,1)=="І") or

(substr($str,$i+$j,1)=="е") or (substr($str,$i+$j,1)=="Е") )

{

if ($mm==0) {$mm=2;}

}

if (substr($str,$i+$j,1)==" ") {break;}

}

for ($j=0;$j<=10;$j++) //вправо тв

{ if (

(substr($str,$i+$j,1)=="а") or (substr($str,$i+$j,1)=="о") or

(substr($str,$i+$j,1)=="ы") or

(substr($str,$i+$j,1)=="А") or (substr($str,$i+$j,1)=="О") or

(substr($str,$i+$j,1)=="Ы") or

(substr($str,$i+$j,1)=="~") or (substr($str,$i+$j,1)=="^") or

(substr($str,$i+$j,1)=="э") or

(substr($str,$i+$j,1)=="Э") or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{

if ($mm==0) {$mm=1;}

}

if (substr($str,$i+$j,1)==" ") {break;}

}

for ($j=0;$j<=10;$j++) //влевомяг

{

if (

(substr($str,$i-$j,1)=="@") or (substr($str,$i-$j,1)=="|") or

(substr($str,$i-$j,1)=="/") or (substr($str,$i-$j,1)=="*") or

(substr($str,$i-$j,1)=="%") or (substr($str,$i-$j,1)=="$") or

(substr($str,$i-$j,1)=="і") or (substr($str,$i-$j,1)=="І") or

(substr($str,$i-$j,1)=="е") or (substr($str,$i-$j,1)=="Е") )

{

if ($mm==0) { $mm=2;}

}

Page 83: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

83

if (substr($str,$i-$j,1)==" ") {break;}

}

for ($j=0;$j<=10;$j++) //влевотв

{

if (

(substr($str,$i-$j,1)=="а") or (substr($str,$i-$j,1)=="о") or (substr($str,$i-

$j,1)=="ы") or

(substr($str,$i-$j,1)=="А") or (substr($str,$i-$j,1)=="О") or (substr($str,$i-

$j,1)=="Ы") or

(substr($str,$i-$j,1)=="^") or (substr($str,$i-$j,1)=="~") or (substr($str,$i-

$j,1)=="э") or

(substr($str,$i-$j,1)=="Э")or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{

if ($mm==0) {$mm=1; }

}

if (substr($str,$i-$j,1)==" ") {break; }

}

if ($mm==0) { //нет гласных - один слог

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=($w1.'ій'.$w2);

}

if ($mm==1) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=($w1.'ый'.$w2);

}

if ($mm==2) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=($w1.'ій'.$w2);

}}}

for ($i=0;$i<strlen($str);$i++)

{ if (($str{$i}=="ю") or ($str{$i}=="Ю") )

Page 84: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

84

{$mm=0;

{ for ($j=0;$j<=10;$j++)

{

if (

(substr($str,$i+$j,1)=="@") or (substr($str,$i+$j,1)=="|") or

(substr($str,$i+$j,1)=="/") or (substr($str,$i+$j,1)=="*") or

(substr($str,$i+$j,1)=="%") or (substr($str,$i+$j,1)=="$") or

(substr($str,$i+$j,1)=="і") or (substr($str,$i+$j,1)=="І") or

(substr($str,$i+$j,1)=="е") or (substr($str,$i+$j,1)=="Е") )

{

if ($mm==0) {$mm=2;}

}

if (substr($str,$i+$j,1)==" ") {break;}

}

for ($j=0;$j<=10;$j++)

{

if (

(substr($str,$i+$j,1)=="а") or (substr($str,$i+$j,1)=="о") or

(substr($str,$i+$j,1)=="ы") or

(substr($str,$i+$j,1)=="А") or (substr($str,$i+$j,1)=="О") or

(substr($str,$i+$j,1)=="Ы") or

(substr($str,$i+$j,1)=="~") or (substr($str,$i+$j,1)=="^") or

(substr($str,$i+$j,1)=="э") or

(substr($str,$i+$j,1)=="Э") or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{

if ($mm==0) {$mm=1;}

}

if (substr($str,$i+$j,1)==" ") {break;}

}

for ($j=0;$j<=10;$j++)

{ if (

(substr($str,$i-$j,1)=="@") or (substr($str,$i-$j,1)=="|") or

(substr($str,$i-$j,1)=="/") or (substr($str,$i-$j,1)=="*") or

(substr($str,$i-$j,1)=="%") or (substr($str,$i-$j,1)=="$") or

Page 85: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

85

(substr($str,$i-$j,1)=="і") or (substr($str,$i-$j,1)=="І") or

(substr($str,$i-$j,1)=="е") or (substr($str,$i-$j,1)=="Е") )

{

if ($mm==0) { $mm=2;}

}

if (substr($str,$i-$j,1)==" ") {break;} }

for ($j=0;$j<=10;$j++) //влевотв

{ if (

(substr($str,$i-$j,1)=="а") or (substr($str,$i-$j,1)=="о") or (substr($str,$i-

$j,1)=="ы") or

(substr($str,$i-$j,1)=="А") or (substr($str,$i-$j,1)=="О") or (substr($str,$i-

$j,1)=="Ы") or

(substr($str,$i-$j,1)=="^") or (substr($str,$i-$j,1)=="~") or (substr($str,$i-

$j,1)=="э") or

(substr($str,$i-$j,1)=="Э")or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{

if ($mm==0) {$mm=1; }

}

if (substr($str,$i-$j,1)==" ") {break; }

}

if (($mm==1) or ($mm==0) ) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=($w1.'й~'.$w2);

}

if ($mm==2) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=($w1.'й%'.$w2);

}}}}

for ($i=0;$i<strlen($str);$i++)

{

if (($str{$i}=="у") or ($str{$i}=="У"))

{ $mm=0;

Page 86: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

86

if ( ($str{$i-1}!="а") and ($str{$i-1}!="А") and ($str{$i-1}!="о") and ($str{$i-1}!="О") and

($str{$i-1}!="е") and ($str{$i-1}!="Е") and ($str{$i-1}!="ы") and ($str{$i-1}!="Ы") and

($str{$i-1}!="э") and ($str{$i-1}!="Э") and ($str{$i-1}!="ю") and ($str{$i-1}!="Ю") and

($str{$i-1}!="я") and ($str{$i-1}!="Я") and ($str{$i-1}!="и") and ($str{$i-1}!="И") ){

if

(($str{$i-1}=="б") or ($str{$i-1}=="Б") or

($str{$i-1}=="в") or ($str{$i-1}=="В") or

($str{$i-1}=="г") or ($str{$i-1}=="Г") or

($str{$i-1}=="з") or ($str{$i-1}=="З") or

($str{$i-1}=="ж") or ($str{$i-1}=="Ж") or

($str{$i-1}=="д") or ($str{$i-1}=="Д") or

($str{$i-1}=="ф") or ($str{$i-1}=="Ф") or

($str{$i-1}=="к") or ($str{$i-1}=="К") or

($str{$i-1}=="л") or ($str{$i-1}=="Л") or

($str{$i-1}=="м") or ($str{$i-1}=="М") or

($str{$i-1}=="н") or ($str{$i-1}=="Н") or

($str{$i-1}=="п") or ($str{$i-1}=="П") or

($str{$i-1}=="р") or ($str{$i-1}=="Р") or

($str{$i-1}=="с") or ($str{$i-1}=="С") or

($str{$i-1}=="ц") or ($str{$i-1}=="Ц") or

($str{$i-1}=="т") or ($str{$i-1}=="Т") or

($str{$i-1}=="х") or ($str{$i-1}=="Х") or

($str{$i-1}=="ш") or ($str{$i-1}=="Ш") or

($str{$i-1}=="[") or ($str{$i-1}=="]") or

($str{$i-1}=="{") or ($str{$i-1}=="}")

){

for ($j=0;$j<=10;$j++)

{ if (

(substr($str,$i+$j,1)=="@") or (substr($str,$i+$j,1)=="|") or

(substr($str,$i+$j,1)=="/") or (substr($str,$i+$j,1)=="*") or

(substr($str,$i+$j,1)=="%") or (substr($str,$i+$j,1)=="$") or

(substr($str,$i+$j,1)=="і") or (substr($str,$i+$j,1)=="І") or

(substr($str,$i+$j,1)=="е") or (substr($str,$i+$j,1)=="Е") )

{

if ($mm==0) {$mm=2;}

Page 87: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

87

}

if (substr($str,$i+$j,1)==" ") {break;} }

for ($j=0;$j<=10;$j++) //влевомяг

{ if (

(substr($str,$i-$j,1)=="@") or (substr($str,$i-$j,1)=="|") or

(substr($str,$i-$j,1)=="/") or (substr($str,$i-$j,1)=="*") or

(substr($str,$i-$j,1)=="%") or (substr($str,$i-$j,1)=="$") or

(substr($str,$i-$j,1)=="і") or (substr($str,$i-$j,1)=="І") or

(substr($str,$i-$j,1)=="е") or (substr($str,$i-$j,1)=="Е") )

{

if ($mm==0) { $mm=2;}

}

if (substr($str,$i-$j,1)==" ") {break;} }

for ($j=0;$j<=10;$j++) //вправо тв

{ if (

(substr($str,$i+$j,1)=="а") or (substr($str,$i+$j,1)=="о") or

(substr($str,$i+$j,1)=="ы") or

(substr($str,$i+$j,1)=="А") or (substr($str,$i+$j,1)=="О") or

(substr($str,$i+$j,1)=="Ы") or

(substr($str,$i+$j,1)=="~") or (substr($str,$i+$j,1)=="^") or

(substr($str,$i+$j,1)=="э") or

(substr($str,$i+$j,1)=="Э") or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{

if ($mm==0) {$mm=1;}

}

if (substr($str,$i+$j,1)==" ") {break;} }

for ($j=0;$j<=10;$j++) //влевотв

{ if (

(substr($str,$i-$j,1)=="а") or (substr($str,$i-$j,1)=="о") or (substr($str,$i-

$j,1)=="ы") or

(substr($str,$i-$j,1)=="А") or (substr($str,$i-$j,1)=="О") or (substr($str,$i-

$j,1)=="Ы") or

(substr($str,$i-$j,1)=="^") or (substr($str,$i-$j,1)=="~") or (substr($str,$i-

$j,1)=="э") or

Page 88: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

88

(substr($str,$i-$j,1)=="Э")or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{

if ($mm==0) {$mm=1; }

}

if (substr($str,$i-$j,1)==" ") {break; } }

if ($mm==1) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

if (

($str{$i+1}=='в') or ($str{$i+1}=='В') or

($str{$i+1}=="б") or ($str{$i+1}=="Б") or

($str{$i+1}=="г") or ($str{$i+1}=="Г") or

($str{$i+1}=="з") or ($str{$i+1}=="З") or

($str{$i+1}=="ж") or ($str{$i+1}=="Ж") or

($str{$i+1}=="д") or ($str{$i+1}=="Д") or

($str{$i+1}=="ф") or ($str{$i+1}=="Ф") or

($str{$i+1}=="к") or ($str{$i+1}=="К") or

($str{$i+1}=="л") or ($str{$i+1}=="Л") or

($str{$i+1}=="м") or ($str{$i+1}=="М") or

($str{$i+1}=="н") or ($str{$i+1}=="Н") or

($str{$i+1}=="п") or ($str{$i+1}=="П") or

($str{$i+1}=="р") or ($str{$i+1}=="Р") or

($str{$i+1}=="с") or ($str{$i+1}=="С") or

($str{$i+1}=="т") or ($str{$i+1}=="Т") or

($str{$i+1}=="х") or ($str{$i+1}=="Х") or

($str{$i+1}=="[") or ($str{$i+1}=="]") or

($str{$i+1}=="{") or ($str{$i+1}=="}") or

($str{$i+1}=="ш") or ($str{$i+1}=="Ш") )

{

$str=($w1.'~'.$w2);

}

else

{ $str=($w1.'~`'.$w2);} }

if ($mm==2) {

Page 89: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

89

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

if (

($str{$i+1}=='в') or ($str{$i+1}=='В') or

($str{$i+1}=="б") or ($str{$i+1}=="Б") or

($str{$i+1}=="г") or ($str{$i+1}=="Г") or

($str{$i+1}=="з") or ($str{$i+1}=="З") or

($str{$i+1}=="ж") or ($str{$i+1}=="Ж") or

($str{$i+1}=="д") or ($str{$i+1}=="Д") or

($str{$i+1}=="ф") or ($str{$i+1}=="Ф") or

($str{$i+1}=="к") or ($str{$i+1}=="К") or

($str{$i+1}=="л") or ($str{$i+1}=="Л") or

($str{$i+1}=="м") or ($str{$i+1}=="М") or

($str{$i+1}=="н") or ($str{$i+1}=="Н") or

($str{$i+1}=="п") or ($str{$i+1}=="П") or

($str{$i+1}=="р") or ($str{$i+1}=="Р") or

($str{$i+1}=="с") or ($str{$i+1}=="С") or

($str{$i+1}=="т") or ($str{$i+1}=="Т") or

($str{$i+1}=="х") or ($str{$i+1}=="Х") or

($str{$i+1}=="[") or ($str{$i+1}=="]") or

($str{$i+1}=="{") or ($str{$i+1}=="}") or

($str{$i+1}=="ш") or ($str{$i+1}=="Ш") )

{ $str=($w1.'%'.$w2); }

else { $str=($w1.'%`'.$w2);} }

if ($mm==0) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=($w1.'~`'.$w2);

}}}

else

{ $w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=($w1.'`'.$w2);}}}

for ($i=0;$i<strlen($str);$i++)

{if (($str{$i}=="у") or ($str{$i}=="У")){ $mm=0;{

Page 90: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

90

if(($str{$i+1}=="б") or ($str{$i+1}=="Б") or

($str{$i+1}=="в") or ($str{$i+1}=="В") or

($str{$i+1}=="г") or ($str{$i+1}=="Г") or

($str{$i+1}=="з") or ($str{$i+1}=="З") or

($str{$i+1}=="ж") or ($str{$i+1}=="Ж") or

($str{$i+1}=="д") or ($str{$i+1}=="Д") or

($str{$i+1}=="ф") or ($str{$i+1}=="Ф") or

($str{$i+1}=="к") or ($str{$i+1}=="К") or

($str{$i+1}=="л") or ($str{$i+1}=="Л") or

($str{$i+1}=="м") or ($str{$i+1}=="М") or

($str{$i+1}=="н") or ($str{$i+1}=="Н") or

($str{$i+1}=="п") or ($str{$i+1}=="П") or

($str{$i+1}=="р") or ($str{$i+1}=="Р") or

($str{$i+1}=="с") or ($str{$i+1}=="С") or

($str{$i+1}=="ц") or ($str{$i+1}=="Ц") or

($str{$i+1}=="т") or ($str{$i+1}=="Т") or

($str{$i+1}=="х") or ($str{$i+1}=="Х") or

($str{$i+1}=="ш") or ($str{$i+1}=="Ш") or

($str{$i+1}=="[") or ($str{$i+1}=="]") or

($str{$i+1}=="{") or ($str{$i+1}=="}") )

{ for ($j=0;$j<=10;$j++) //вправомяг

{

if (

(substr($str,$i+$j,1)=="@") or (substr($str,$i+$j,1)=="|") or

(substr($str,$i+$j,1)=="/") or (substr($str,$i+$j,1)=="*") or

(substr($str,$i+$j,1)=="%") or (substr($str,$i+$j,1)=="$") or

(substr($str,$i+$j,1)=="і") or (substr($str,$i+$j,1)=="І") or

(substr($str,$i+$j,1)=="е") or (substr($str,$i+$j,1)=="Е") )

{

if ($mm==0) {$mm=2;}

}

if (substr($str,$i+$j,1)==" ") {break;}

}

for ($j=0;$j<=10;$j++) //влевомяг

{

Page 91: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

91

if (

(substr($str,$i-$j,1)=="@") or (substr($str,$i-$j,1)=="|") or

(substr($str,$i-$j,1)=="/") or (substr($str,$i-$j,1)=="*") or

(substr($str,$i-$j,1)=="%") or (substr($str,$i-$j,1)=="$") or

(substr($str,$i-$j,1)=="і") or (substr($str,$i-$j,1)=="І") or

(substr($str,$i-$j,1)=="е") or (substr($str,$i-$j,1)=="Е") )

{

if ($mm==0) { $mm=2;}

}

if (substr($str,$i-$j,1)==" ") {break;}

}

for ($j=0;$j<=10;$j++) //вправо тв

{ if (

(substr($str,$i+$j,1)=="а") or (substr($str,$i+$j,1)=="о") or

(substr($str,$i+$j,1)=="ы") or

(substr($str,$i+$j,1)=="А") or (substr($str,$i+$j,1)=="О") or

(substr($str,$i+$j,1)=="Ы") or

(substr($str,$i+$j,1)=="~") or (substr($str,$i+$j,1)=="^") or

(substr($str,$i+$j,1)=="э") or

(substr($str,$i+$j,1)=="Э") or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{

if ($mm==0) {$mm=1;}

}

if (substr($str,$i+$j,1)==" ") {break;}

}

for ($j=0;$j<=10;$j++) //влевотв

{

if (

(substr($str,$i-$j,1)=="а") or (substr($str,$i-$j,1)=="о") or (substr($str,$i-

$j,1)=="ы") or

(substr($str,$i-$j,1)=="А") or (substr($str,$i-$j,1)=="О") or (substr($str,$i-

$j,1)=="Ы") or

Page 92: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

92

(substr($str,$i-$j,1)=="^") or (substr($str,$i-$j,1)=="~") or (substr($str,$i-

$j,1)=="э") or

(substr($str,$i-$j,1)=="Э")or (substr($str,$i+$j,1)=="я") or

(substr($str,$i+$j,1)=="Я") )

{ if ($mm==0) {$mm=1; } }

if (substr($str,$i-$j,1)==" ") {break; } }

if ($mm==1) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

$str=($w1.'~'.$w2); }

if ($mm==2) {

$w1=substr($str,0,$i);

$w2=substr($str,$i+1);

}}}}}

$q2=array("%","$","@","|","/","*","~","^","{","}","[","]","`");

$q1=array("&#1199;","&#1198;","&#1241;","&#1240;","&#1257;","&#1256;","&#1201;","&#

1200;","&#1178;","&#1179;","&#1170;","&#1171;","у");

$str = str_replace($q2, $q1, $str);

$q1=array("ё","э","Ё","Э", "&#1211;","&#1210;", "Ъ","зійдент","ЗІЙДЕНТ","ь","Ь");

$q2=array("е","е","Е","Е","х", "Х", "ЫЙ","зідент","ЗІДЕНТ","","");

$str = str_replace($q1, $q2, $str);

$q1=array("йй","ЙЙ");

$q2=array("й","Й");

$str = str_replace($q1, $q2, $str);

echo "$str";

?>

</textarea></td><td align=center>

<h3>&#1200сынылатын&#1241ліпбидегін&#1241тижелім&#1241тін:</h3>

<textarea rows=18 cols=40 name=res2>

<?$healthy = array("А","&#1240;","Б",

"Г","&#1170;","Д","Е","Ж","З","И","Й","К","&#1178;","Л","М","Н","&#1186;","О","&#1256

;","П","Р","С","Т","У","&#1200;","&#1198;","В","Ф","Х","&#1210;","Ц","Ч","Ш","Щ","Ъ","

Ы","І","Ь","Э","Ю","Я","а","&#1241;","б",

"г","&#1171;","д","е","ж","з","и","й","к","&#1179;","л","м","н","&#1187;","о","&#1257;","п"

Page 93: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

93

,"р","с","т","у","&#1201;","&#1199;","в","ф","х","&#1211;","ц","ч","ш","щ","ъ","ы","і","ь","э

","ю","я");

$str = str_replace($healthy, $yummy, $str);

echo "$str";?>

</textarea></td></tr><tr><td colspan=3 align=center>

<input type = submit name='konv' value = ' >>АУДАРУ>> '></td></tr></table>

<br><table width = "100%" align=center border=0 ><tr>

<td width =50% bgcolor = "#ccccff" align=center>

<? echo "<a href=' matin1.php'><b>АУДАРЫЛ&#1170АНМ&#1240ТІНДЕР</a> ";?>

</td></tr></table>

Page 94: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

94

ҚОСЫМША В

ҒЗЖ-ның 2014 жылғы күнтізбелік жоспары

Page 95: НИИ Искусственный интеллектe-zerde.kz/zerde/files/new/Latinica2015.pdfНИИ Искусственный интеллект 3 ОРЫНДАУШЫЛАР ТІЗІМІ

НИИ

Иску

сств

енны

й ин

телл

ект

95