Программасы сөйлемдердің құрылымын, сөздің мағынасын ескере отырып түсінікті аударма



жүктеу 0.67 Mb.
Pdf просмотр
Дата12.03.2017
өлшемі0.67 Mb.
түріПрограмма

291 

 

 



 

 

 

Сурет 2.3. Сөйлем аудару. 



 

Қорытындылай келе, машиналық аударма қазіргі кезде үлкен сұранысқа ие екені белгілі.  

Қазіргі  таңда  жұмыс  істеп  тұрған  қазақ  тілінен  орыс  тіліне  аударатын  demo_kaz_rus 

программасы сөйлемдердің құрылымын, сөздің мағынасын ескере отырып түсінікті аударма 

жасауда.  Еліміздегі  машиналық  аудармалардың  сапасын  арттыру  мақсатында  атқарылып 

жатқан жобаның тиімділігі айқын. 

 

Әдебиеттер 

1.  Бектаев,  К.Б.  Большой  казахско  -  русский,  русско-казахский  словарь  /  Калдыбай 

Бектайұлы Бектаев.- Алматы: Алтын қазына, 2007.- 709 с. 

 

 

У.А. ТӨКЕЕВ, С.З. САПАҚОВА 

 

 

Әл-Фараби атындағы ҚазҰУ, Алматы, Қазақстан 

 

 

ҚАЗАҚ ТІЛІНЕН ОРЫС ТІЛІНЕ МАШИНАЛЫҚ АУДАРМА 

 

1.



 

Қазақ тілді машиналық аудармашыларға қысқаша шолу 

Қазіргі  таңда  қазақ  тілінен  өзге  тілдерге  аударатын  программалар,  онлайн-аудармалар 

баршылық,  бірақ  олардың  жұмыс  нәтижесі  мардымды  емес.  Оның  ең  негізгі  себебі  қазақ 

тілінің грамматикасының басқа тілдің грамматикасына қарағанда анағұрлым күрделілігі, өзге 

тілдің  грамматикасына  ұқсамайтындығында.  Еліміздегі  қазіргі  кезде  кеңінен  қолданылып 

жүрген  sozdik.kz,  soylem.kz,  sanasoft.kz  секілді  онлайн  аудармашылармен  қатар  «Ізет-

тілмәш» қолданбалы программасында қазақ тілінен орыс тіліне аудару мүмкіндігі бар. Бірақ 

бұл аудармашы программалар енгізілген сөздерді аударғанымен сөйлемнің құрылымына, сөз 

мағынасына аса мән бермейтінін олардан алынған нәтижелерден көре  аламыз. Айта кететін 

жайт  осы  айтылған  машиналық  аудармаларда  сөйлемдер  енгізіп,  оларды  аударатын  болсақ 

ол сөздердің көп жағдайда орнын өзгертпей, басқа мағыналарын қарастырмайтынын көреміз, 


292 

 

яғни  түсініксіз  аудармаларға  грамматика  толық  қарастырылмағандықтан  тап  боламыз,  оны 



дәлелдемесекте  болады.  Сонымен  қатар,  бұл  бағытта  атқарылып  жатқан  іс-шараларды  да 

атап кететін болсақ, «ағылшын- қазақ» машиналық аударма бағытында Apertium програмасы 

Микель  L.  Forcada  (Испания)  басшылығымен  және  әл-Фараби  атындағы  Қазақ  Ұлттық 

Университетінің  қолдауымен,  free/  машиналық  аударманың  ашық  кодты  платформасы 

пайдаланылуда.  Apertium  –бұл  машиналық  аударма  жүйесінің  ашық  кодасын  құруға 

арналған құралдардың жиыны, әсіресе өзара байланысқан тілдер жұбы үшін ыңғайлы, оның 

құрамына  ашық  лингвистивкалық  мәліметтерге  арналған  бірнеше  сөздіктер,  техникалық 

қызмет  көрсету  т.с.с.  енетінін  білеміз.  Осы  бағдарлама  негізінде  «қазақ-  татар»  тілдер 

бағытындағы ашық кодалы жүйе құрып, онымен қарқынды айналысып жатқан ғалымдарды: 

Ильнар Салимзянов, Джонатан Вашингтон және Фрэнсис Tyers атап кетуге болады. 

Ұсынылып  отырған  жұмыс  қазақ-орыс  бағытында  құрылған  машиналық  аударма 

жүйесінің  негізгі  жұмыс  істеу  принциптеріне,  қазіргі  таңда  туындаған  мәселерге  тікелей 

байланысты.    Жұмыс  нәтижесінде  шағын  «kaz-rus  translator»  қолданбалы  программасы 

жасалынды және одан әрі дамыту үстіндеміз, бұл программа Visual Studio 2010 және SQLite 

орталарында орындалды. 

 

2.



 

Қазақ тілінен орыс тіліне аудару барысындағы морфологиялық талдау сұлбасы 

Қазіргі  уақытта  машиналық  аударма  барысында  бірнеше  бөліктерден  тұратын  күрделі 

жүйе қолданылады, мысалы: 

 



Морфологогиялық талдау – мәтіндегі сөздерді талдау 

 



Синтаксистік талдау – сөйлемдерді, грамматиканы және сөздер арасындағы 

байланыстарды талдау; 

 

Семантикалық талдау – белгілі бір пәндік аймаққа бағытталған деректер қоры 



негізінде әр сөйлемнің мағынасын талдау. 

 



Прагматикалық талдау- өзіндік мәліметтер қоры негізінде белігілі бір контекстің 

ауқымында сөйлемнің мағынасын талдау.  



 

 

293 

 

 

 

Сұлба 1. Қазақ тілінен орыс тіліне сөз аударудың блок-сұлбасы. 



 

294 

 

Бұл сұлбадан көретініміз морфологиялық талдауда маңызды рол атқаратын жалғаулардың 



МҚ  бөлек  кесте  түрінде  сақталуы.  МҚ  «жалғаулар»  кестесінде  кездесетін  753  жалғауды 

Бектаевтың сөздіктер кітабынан [1] енгіздік. Бектаевтың сөздігінде қазақ тілінде кездесетін 

барлық  қосымшаларды  қарастырылған,  сол  сөздік  бойынша  қосымшалардың  жалғану  реті 

жасалынды.  Мысалы,  бара-лар-ымыз-дың  деген  сөзді  алсақ,  қосымшалардың  жалғану  реті 

былай болады: Р – К – Ж – Т (түбір – көптік жалғау – жіктік жалғау – тәуелдік жалғау). Осы 

қосымшалардың  бүкіл  жағдайын  қарастырып,  барлығын  қосындыласақ    753  қосымша 

шығады (2-сұлба).  

 

 



 

Сұлба 2. Қазақ тіліндегі жұрнақтардың жалғану реті. 

 

Қарастырылып  отырған  тілдер  жұбында,  әр  тілдің  өзіндік  ерекшеліктері  мен  олардың 



арасындағы  бірмәнді  сәйкестік  болмайтынын  да  айқын  көреміз.  Мысалы,  қазақ  тіліндегі 

әртүрлі  сөз  таптарының  өзіне  тиселі  жалғаулары  бар,  ол  басқа  сөз  табына  жалғанбайды, 

сонымен  қатар  бірнеше  сөз  табына  жалғанатындары  да  бар.  Осы  ерекшеліктерді  ескере 

отырып, біз жалғаулар кестесіне келесі атрибуттарды пайдаландық  

 

 

Сұлба 3. Жалғаулар кестесінің атрибуттары. 



295 

 

Бұл жұмыста қарастырылып отырған Мәліметтер қорының құрылымы келесідей: 



 

 

Сұлба 4. Мәліметтер қорының шағын сұлбасы. 



 

Әрқайсысына келесідей жекеленген түсініктеме беріп кетуге болады: 

 

zat (зат есімнің қазақша-орысша аудармасы) 



 

syn (сын есімнің қазақша-орысша аудармасы) 

 

san_esim (сан есімнің қазақша-орысша аудармасы) 



 

etistik (етістіктің қазақша-орысша аудармасы) 

 

usteu (үстеудің қазақша-орысша аудармасы) 



 

esimdik (есімдіктің қазақша-орысша аудармасы) 

 

predlog (орыс тіліндегі предлог) 



 

zhalgaular (қазақ тіліндегі барлық мүмкін болатын жалғаулар) 

 

skl1 (орыс тіліндегі склонение 1-дің жалғаулары) 



 

skl2 (орыс тіліндегі склонение 2-дің жалғаулары) 

 

skl3 (орыс тіліндегі склонение 3-дің жалғаулары) 



 

iya (орыс тілінде ия-ға бітетін зат есімдердің жалғаулары)  

 

iyi (орыс тілінде ий-ға бітетін зат есімдердің жалғаулары) 



 

pril_skl (орыс тіліндегі сын есімнің жалғаулары) 

 

glagol_spr (орыс тіліндегі етістіктің жалғаулары) 



 

Осы  МҚ  кестелердің,  әрқайсысының  ерекшеліктері  ескеріле  отырып,  келесі  түрдегі 

атрибуттар тағайындалды.  


296 

 

 



 

 

Сұлба 5. Сөз таптарының және көмекші кестелердің атрибуттары. 



297 

 

 



 

Сурет 1. Мәліметтер қорындағы «Жалғаулар» кестесі. 

 

Мысал,  «үстелдердің» көпше түрдегі сөзді аудару процесін қарастырсақ.  



 <үстелдердің>::=<үстел><дердің> 

<үстел>::=<стол> 

<дердің>::= 

 

 



Сұлба 7. Морфологиялық генератордың сұлбасы. 

 

Сұраныс  бойынша  МҚ    «ов»  жалғауы  алынады  және  сөздің  соңына  жалғанады. 



«үстелдердің» - «столов». 

Бұл  жұмыста  бүкіл  атқарылып  жатқан  жұмыстардың  сипаттамасын,  ішкі  құрылымын 

көрсету  мүмкін  емес,  сондықтан  «зат  есім»  сөз  табының  маңызды  жақтарын  қарастырсақ. 


298 

 

Соның  ішінде  Септік  жалғаулары  жобада  толық  қарастырылған.  Мысал  ретінде  Табыс 



септігін алсақ, ол орыс тіліндегі винительный падежге сәйкес.   

1-склонение. Егер енгізілген сөздің соңғы әріпі  «а» және оның соңғы әрпінің алдындағы 

әрпі келесі жиыннан болса,  pb[]={ 'б', 'в', 'г', 'д', 'ж', 'з', 'к', 'л', 'м', 'н', 'п', 'р', 'с', 'т', 'ф', 'ч', 'ш', 'щ', 

'х', ‘ц’}, онда аударылған сөздің соңына «у» жалғауы жалғанады, мысалы, көлікті =>машину.  

 

–у  немесе –ю жалғауларын жалғау ережелері: 

МҚ келесі атрибуттары бар сұраныс түседі: padezh=4, chislo=1, rod=2.  

 

string[] string1 = new string[] { "я" }; 



    if (defineVariables.skl[defineVariables.i] == "1") 

    {  if (padezh == "4") 

{if 

(string1.Contains(defineVariables.words_rus[defineVariables.i].Substring(defineVariables.words_r



us[defineVariables.i].Length - 2, 1))) 

 { defineVariables.words_rus[defineVariables.i] =                    

defineVariables.words_rus[defineVariables.i].Substring(0, 

defineVariables.words_rus[defineVariables.i].Length - 1) + okonch2; } 

 else    {   defineVariables.words_rus[defineVariables.i] = 

defineVariables.words_rus[defineVariables.i].Substring(0, 

defineVariables.words_rus[defineVariables.i].Length - 1) + okonch1;            } 

 

Нәтижесі:  

 

 

Сурет 2. Зат есімдер кестесі мен сұраныстар кестесінің нәтижесі. 



 

Kaz-Rus  translator  жұмыс  нәтижесін  көрсететін  болсақ  келесі  қарапайым  сөйлемдерді 

аударады.  

 


299 

 

 



 

Сурет 3. Kaz-Rus translator жұмыс нәтижесі. 



 

Қорыта айтқанда,  

 



қазақ  тілінен  орыс  тіліне  аударатын  машиналық  аудармалар  салыстырылып,  оларға 

талдау жасалды, яғни сапалы машиналық аударма алу үшін кеткен қателіктер зерттелді; 

 

машиналық  аударманың  негізі  болып  табылатын  мәліметтер  қорын  толтыру 



нұсқалары қарастылып ең тиімді шешім алынды, кестелерге қажетті атрибуттар аныөталды; 

 



12000  сөз  енгізілген  мәліметтер  қорына  программа  күрделілік  деңгейін  азайту  үшін 

орыс тілінің жалғаулары қосылды; 

 

қазақ тілінен орыс тіліне машиналық аудармада кездесетін қиындықтар талқыланып, 



шешуге қажетті модульдер құрылды. 

   


Әдебиеттер  

1.

 



Бектаев, К.Б. Большой казахско - русский, русско-казахский словарь / Калдыбай Бектайұлы 

Бектаев.- Алматы: Алтын қазына, 2007.- 709 с. 

 

 

N.Z. ABDURAKHMONOVA 



 

 

National University of Uzbekistan named after Mirzo, Tashkent, Uzbekistan 

 

 

GRAMMATICAL ANALYZE IN MACHINE TRANSLATION  

BETWEEN ENGLISH AND UZBEK 

 

Today human society characterizes high degree of activity in different fields such as economy, 



science,  technology,  culture  etc.  And  it  has  caused  to  increase  body  of  information  that  presents 

some  difficulties  between  person  to  person  or  among  the  group  of  people.  Computer  has  being 

considered  one  of  the  main  approaches  to  ease  opportunities  of  people  since  it  was  invented.  So 

machine  translation  is  used  to  exchange  information  communicative  attitudes.    Translation  of  the 

text  is  very  complex  creative  process  from  a  natural  language  into  another  one.  We  can  see  now 

variety   forms of machine translation system; even they can recognize speech and translate orally. 



Most of them are multilingual translation programs. The Uzbek language is being developed rapidly 



Поделитесь с Вашими друзьями:


©emirsaba.org 2019
әкімшілігінің қараңыз

    Басты бет