Атты І халықаралық конференция ЕҢбектеріжүктеу 0.62 Mb.
Pdf просмотр
Дата03.03.2017
өлшемі0.62 Mb.

 

  

 

 

 

 

 

ҚАЗАҚСТАН РЕСПУБЛИКАСЫ БІЛІМ ЖӘНЕ ҒЫЛЫМ МИНИСТРЛІГІ 

Л. Н. ГУМИЛЕВ АТЫНДАҒЫ ЕУРАЗИЯ ҰЛТТЫҚ УНИВЕРСИТЕТІ 

 

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН 

ЕВРАЗИЙСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ 

ИМ. Л. Н. ГУМИЛЕВА 

 

THE MINISTRY OF EDUCATION AND SCIENCES OF REPUBLIC KAZAKHSTAN 

 L.N.GUMILYOV EURASIAN NATIONAL UNIVERSITY 

 

«Түркі тілдерін компьютерлік өңдеу»  

атты І халықаралық конференция  

ЕҢБЕКТЕРІ 

 

ТРУДЫ 

І Международной конференции  

"Компьютерная обработка тюркских языков" 

 

PROCEEDINGS 

Of the I International Conference  

on Computer processing of Turkic Languages (TurkLang-2013) 

 

 

  

 

  

 

  

 

АСТАНА, 2013 

 

УДК 81’322 ББК 81.1 

Т 90 

 

 

 

 

Т 90  ТҮРКІ ТІЛДЕРІН КОМПЬЮТЕРЛІК ӨҢДЕУ. Бірінші халықаралық 

конференция: Еңбектері/ Астана: Л.Н.Гумилев атындағы ЕҰУ баспасы, 2013- 

340 бет 

КОМПЬЮТЕРНАЯ  ОБРАБОТКА  ТЮРКСКИХ  ЯЗЫКОВ.  Первая 

международная конференция: Труды. – Астана: ЕНУ им. Л.Н. Гумилева, 2013. – 

340 с. 

 

ISBN 

978-601-7454-85-2

 

 

Жинақта  «Түркі  тілдерін  компьютерлік  өңдеу»  атты  I  халықаралық 

конференция қатысушыларының баяндамалары енген. 

Компьютерлік  лингвистика  бағыты  бойынша  оқитын  студенттерге, 

магистранттарға, докторанттарға және мамандарға арналған. 

 

В  сборнике  представлены  доклады  участников  I  международной конференции «Компьютерная обработка тюркских языков». 

Предназначен для студентов, магистрантов, докторантов и специалистов 

специализирующихся в областях компьютерной лингвистика. 

 

УДК 81’322 ББК 81.1 

 

 

Техникалық редакция:        Бурибаева А.К. 

Муканова А. С. 

Ергеш Б.Ж. 

Елибаева Г.З. 

 

©  


Л.Н.Гумилев атындағы Еуразия ұлттық университеті, 2013 

Евразийский национальный университет им. Л.Н. Гумилева, 2013 

 

ISBN


 

978-601-7454-85-2

 

 

  

14 

 

СӨЙЛЕУЛЕРДІ СИНТЕЗДЕУ ЖӘНЕ ТАНУ ЖҮЙЕЛЕРІ СИСТЕМЫ РАСПОЗНАВАНИЯ И СИНТЕЗА РЕЧИ 

SPEECH RECOGNITION AND SYNTHESIS SYSTEMS 

 

 Ибрагимов Т.И., Салимов Ф.И.  Казанский  федеральный  университет,  Казанский  федеральный  университет, 

Институт прикладной семиотики АН РТ, г.Казань, Россия 

ЛИНГВИСТИЧЕСКИЕ  ПРОБЛЕМЫ  СИНТЕЗА  ТАТАРСКОЙ  РЕЧИ  ПО 

ОРФОГРАФИЧЕСКОМУ ТЕКСТУ 

 

213 

Хусаинов А.Ф. 

НИИ “Прикладная семиотика” академии наук Республики Татарстан 

СИСТЕМА 

АВТОМАТИЧЕСКОГО 

РАСПОЗНАВАНИЯ 

ФОНЕМ 

ТАТАРСКОГО ЯЗЫКА 

 

220 


3  Yessenbayev Zh., Karabalayeva M., Shamayeva F. 

Nazarbayev University Research and Innovation System

 L.N. Gumilyov Eurasian National Univerity, Аstana, 

The  Korkyt-Ata  Kyzylorda  State  University,  KyzylordaA  BASELINE  LARGE 

VOCABULARY CONTINUOUS SPEECH RECOGNITION FOR KAZAKH 

 

226 
Бурибаева А.К. 

Евразийский  национальный  университет  ЕНУ  им.  Л.Н.  Гумилева,  НИИ 

«Искусственный интеллект», Астана 

РАСПОЗНАВАНИЕ  КАЗАХСКИХ  СЛОВ  НА  ОСНОВЕ  ДИФОННОЙ 

БАЗЫ 

 

230 
Алтынбек С.А., Муратбеков М.М., Абылаева Б.М., Тургинбаева А.С. 

Евразийский национальный университет ЕНУ им. Л.Н. Гумилева, Астана 

ЛОГИКА  ПОСТРОЕНИЯ  АЛГОРИТМОВ  НЕЙРОННЫХ  СЕТЕЙ  ДЛЯ 

РАСПОЗНАВАНИЯ РУКОПИСНОГО КАЗАХСКОГО ТЕКСТА 

 

239 
Шарипбаев А.А., Жетимекова Г.Ж. 

Л.Н. Гумилев атындағы Еуразия ұлттық университеті, «Жасанды зерде» ҒЗИ, 

Астана 

Е.А.Бөкетов атындағы ҚарМУ, Қарағанды 

БЕЙНЕНІ  ТАНУ  ЕСЕПТЕРІНДЕ  НАҚТЫ  ЕМЕС  ЛОГИКАНЫҢ 

ҚОЛДАНЫЛУЫ ЖӘНЕ ЕРЕКШЕЛІКТЕРІ 

 

241 


 

 

МӘТІНДЕРДІ СЕМАНТИКАЛЫҚ ӨҢДЕУ ЖҮЙЕЛЕРІ 

СИСТЕМЫ СЕМАНТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВ 

SYSTEMS OF SEMANTIC TEXT PROCESSING

 

 

 Бекманова Г.Т., Жеткенбай Л. Л.Н. Гумилев атындағы Еуразия ұлттық университеті, «Жасанды зерде» ҒЗИ, 

Астана 

ҚАЗАҚ ТІЛІНІҢ КҮРДЕЛІ СӨЗДЕРІН ФОРМАЛДАУ НЕГІЗІНДЕ ЖАСАУ 

 

247 15 

 Бекманова Г.Т., Жеткенбай Л., 

Л.Н. Гумилев атындағы Еуразия ұлттық университеті, «Жасанды зерде» ҒЗИ, 

Астана 

ҚАЗАҚ  КҮРДЕЛІ  СӨЗДЕРІН  ТҮРЛЕНДІРУДІҢ  СЕМАНТИКАЛЫҚ 

МОДЕЛІ 

 

253 

Ергеш М. 

Л.Н. Гумилев атындағы Еуразия ұлттық университеті, Астана 

ҚҰЖАТТАРДАҒЫ 

КІЛТТІК 

СӨЗДЕРДІ 

ВЕКТОРЛЫҚ 

МОДЕЛЬ 

АРҚЫЛЫ ІЗДЕУ 

 

258 
Хакимов М.Х., Арипов М.М. 

Национальный  Университет  Узбекистана  им.  Мирзо  Улугбека  (г.  Ташкент, 

Республика Узбекистан) 

СЕМАНТИЧЕСКИЕ БАЗЫ РУССКОГО ЯЗЫКА  

 

260 


МАШИНАЛЫҚ АУДАРУ ЖҮЙЕЛЕРІ 

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА 

MACHINE TRANSLATION SYSTEMS 

 

 Сулейманов Д.Ш., Гатиатуллин А.Р., Гильмуллин Р.А., Аюпов М.М.  НИИ “Прикладная семиотика” академии наук Республики Татарстан 

К 

РАЗРАБОТКЕ 

ТАТАРСКО-ТУРЕЦКОГО 

МАШИННОГО 

ПЕРЕВОДЧИКА 

 

266 

Хакимов М.Х. 

Национальный  Университет  Узбекистана  им.  Мирзо  Улугбека  (г.  Ташкент, 

Республика Узбекистан) 

МОДЕЛИРУЕМАЯ ТЕХНОЛОГИЯ МАШИННОГО ПЕРЕВОДА 

 

272 

Тукеев У.А., Сапакова С.З., Маратқызы А., Өтепова Қ. 

Әл-Фараби атындағы Қазақ ұлттық университеті, Алматы, Қазақстан 

ҚАЗАҚША-ОРЫСША 

МАШИНАЛЫҚ 

АУДАРМАСЫНЫҢ 

МӘЛІМЕТТЕР БАЗАСЫ ЖӘНЕ ОНЫҢ ҚҰРЫЛЫМЫ 

 

279 
Төкеев У.А., Сапақова С.З. 

Әл-Фараби атындағы Қазақ ұлттық университеті, Алматы, Қазақстан 

ҚАЗАҚ ТІЛІНЕН ОРЫС ТІЛІНЕ МАШИНАЛЫҚ АУДАРМА  

 

286 5  Abdurakhmonova N.Z. 

National University of Uzbekistan named after Mirzo, Tashkent, Uzbekistan 

GRAMMATICAL  ANALYZE  IN  MACHINE  TRANSLATION  BETWEEN 

ENGLISH AND UZBEK 

 

294 

Абдурахмoнова Н.З., Хакимов М.Х.  

Национальный  Университет  Узбекистана  им.  Мирзо  Улугбека  (г.  Ташкент, 

Республика Узбекистан) 

ЛОГИКО-  ЛИНГВИСТИЧЕСКИЕ  МОДЕЛИ  СЛОВ  И  ПРЕДЛОЖЕНИЙ 

АНГЛИЙСКОГО 

ЯЗЫКА 

ДЛЯ 

МНОГОЯЗЫЧНЫХСИТУАЦИЙ 

КОМПЬЮТЕРНОГО ПЕРЕВОДА 

 

297 252 

 

Г.Т. БЕКМАНОВА, Л. ЖЕТКЕНБАЙ  

 

Л.Н. Гумилев атындағы Еуразия ұлттық университеті, 

«Жасанды зерде» ҒЗИ, Астана, Қазақстан 

 

 

ҚАЗАҚ ТІЛІНІҢ КҮРДЕЛІ СӨЗДЕРІН ФОРМАЛДАУ НЕГІЗІНДЕ ЖАСАУ 

 

1980  жылдарға  дейінгі  еңбектерде  сөз  тұлғасының  бір  түрі  –  күрделі  сөз  деген  ұғым морфологиялық  категория  ретінде  қарастырылып  келгені,  1989  жылдан  бастап  сөзжасам 

жүйесінде қарала бастағаны белгілі [1].  

Күрделі  сөздер  қазіргі  тіл  біліміндегі  ең  күрделі  мәселе  болып  табылады,  оның 

анықталмаған  сырлары  мен  қырлары  өте  көп.  Күрделі  сөздер  жоқ  тілді  көрсету  өте  қиын, 

бірақ күрделі сөздер, әсіресе, неміс, ағылшын, жапон, хинди, орыс тілдерінде кең тарағанын 

жазба деректерден көруге болады. Күрделі сөздердің тілдерде алатын орны бірдей емес. Ол 

тілдердің  лексикалық  жүйесінен  әркелкі  орын  алады.  Кейбір  тілдерде  сөздерді  біріктіру 

қосымша тәсіл болып, оның нәтижесі елеусіз болады да, сөздіктің периферия бөлімінен орын 

алады. Келесі бір тілдерде ол кең тараған, негізгі тақырыпқа жатады. Соңғы топтағы тілдерге 

жапон тілі жатады. Лексикадан алатын орнына қарағанда жапон тілін тіпті күрделі сөздің тілі 

деуге де болады. Осындай күрделі сөздерге бай тілдерге түркі тілдері, оның ішінде қазақ тілі 

де  жатады.  Ғалымдар  күрделі  сөздердің  түркі  тілдерінде  жалпы  көне  құбылыс  екенін, 

олардың  орхон  жазба  ескерткіштерінің  тілінде  де  барын  айта  келіп,  ескерткіштер  тіліндегі 

кісі  аттарынан,  жер  су  аттарынан  көптеп  мысал  келтіреді.  Күрделі  сөздер  барлық  басқа 

туынды  сөздер  сияқты  сөзжасам  әрекетінің  нәтижесіне  жатады.  Анығырақ  айтқанда,  ол  – 

туынды сөздер тобындағы сөздер лексикалық бірлік – деп танылатыны белгілі. Олай болса, 

аналитикалық  синтаксистік  тәсіл  арқылы  жасалған  күрделі  сөздер  тілге  белгілі.  Күрделі 

сөздер  сөзжасамның  тілден  үлкен  орын  алатын  аналитикалық  синтаксистік  тәсіл  арқылы 

жасалады.  Сөз  жасамның  аналитикалық  тәсілі  ғылымдағы  көне  әдістердің  бірі  болып 

табылатыны  баршамызға  мәлім.  Осы  тәсілдің  түркі  тілдерінде  атам  заманнан  бері 

қолданылып  келе  жатқанын  орхон  жазба  ескерткіштердің  тілдерінде  қолданылған  йашыл 

үгүз – көк өзен, күнтүз – күндіз, Беш балық – Бес балық (қала аты), Қара құм (жер аты), Білге 

қаған  (хан  аты)  т.б.  күрделі  сөздерден  көруге  болады.  Келтірілген  мысалдар  күрделі 

сөздердің  көне  замандардан  бері  қолданылып  келе  жатқаны  екіншіден,  олардың 

географиялық атаулар, яғни өзен, көл, жер, қала және кісі аттарында жиі кездесетіні айқын 

көрінеді. Осыған қарап, кейбіреулер аналитикалық тәсіл арқылы сөз жасау тәжірибесі түркі 

тілдерінде осы жер – cу, кісі аттарынан басталмады ма екен деген ой айтады[2].  

 

1 Қазақ күрделі сөздерінің түсінігі 

Қазақ тілі сондай-ақ басқа түркі  тілдерінде күрделі  сөз мәселесі  Қазан төңкерісіне дейін 

арнаулы  зерттеудің  объектісіне  айнала  қоймаған  еді.  Түркі  тілдерінің  грамматикалық 

құрылысын  зерттеген  ғалымдардың  еңбектерінде  ол  туралы  азды-көпті  мағлұмат  беріліп 

келді.  Соның  өзінде  күрделі  сөз  лексикалық  емес,  негізінен,  тілдің  грамматикалық 

құрылысы, оның ішінде сөз табы категориясына қатысты жағынан қарастырылатын.  

Ал қазақ тілі мамандарынан бұл мәселені алғаш сөз еткен профессор Қ.Жұбанов. Ол кісі 

1930  жылдардың  өзінде-ақ  күрделі  сөздер  қанша  сөзден  біріксе,  кіріксе  де  тұтас  бір  ғана 

мағынаны білдіреді, бір ғана заттың атауы болады, сөйлемде де сол жұбын жазбай, бір ғана 

мүше  болады,  кейбіреулерінің  құрамындағы  сыңарларының  дыбыстық  өзгеріске  түсуінен 

сыртқы  түр-тұрпаты  басқаша  болып  қалыптасады,  бір  ғана  екпінді  иеленеді  деп  дұрыс 

тұжырымдайды.  

Профессор Н.Т.Сауранбаев  қазақ тіліндегі йзафеттік топтың түрлеріне тоқталған жерінде 

бірінші  топтың өзгешелігі  – синтаксистік шеңберден шығып, морфология, оның ішінде сөз 253 

 

тудыру  жүйесіне  айналған  тәсіл  екенін көрсете  келіп,  йзафеттің  бұл  түрі  қазір  де  тұтас  бір атау (лексема) болып ұғынылатынын айтады.  

Біріккен сөзге арнайы еңбек жазған А.Ермеков біріккен сөздердің сыртқы түр-тұрпаттық 

белгілі  қасиеттеріне,  біріншіден,  тұтас  тұлғалануын,  екіншіден,  сөйлемнің  бір  ғана 

мүшесінің  қызметін  атқаруын,  үшіншіден,  белгілі  сөз  табының  құрамына  кіруін, 

төртіншіден,  бірұдайы  интонациямен  айтылуын,  бесіншіден,  кейбір  компоненттерінің 

бүтіндей,  ия  жартылай  дербес  мағынасынан  айрылуын,  алтыншыдан,  бірге  жазылуын, 

жетіншіден, сөздікте түтін бір сөз ретінде берілуін жатқызады.  

Қазақ тіліндегі біріккен сөзбен шұғылданған екінші бір тіл маманы Г.Жәркешова біріккен 

сөздердің ерекшеліктері дегенге мағына тұтастығын, сөйлемге дербес бір ғана мүше болуын, 

компоненттерінің қалыптасыуына дыбыс үндесу заңы қатысуын жатқызады.  

Профессор А.Ысқақов  соңғы кезде шыққан еңбектерінде күрделі  сөздердің аса маңызды 

мәселелерін  қамтып,  дұрыс  тұжырымдар  жасады,  бірқатар  өзекті  мәселелерді  алға  қойды. 

Күрделі сөздердің әлі де анықталмаған, айқындалмаған мәселелері көп екенін айта отырып, 

мәселелердің  негізгі  түйіндері  біріккен  сөздер  мен  фразалық  тіркестердің,  біріккен  сөздер 

мен  идиомалық  тіркестердің,  біріккен  сөздер  мен  күрделі  атау  сөздердің,  фразалық  тіркес 

пен идиомалық тіркестің араларын ашу, олардың ара қатынастарын анықтау мәселелерімен 

байланысып жатқанын көрсетеді.  

Профессор  Қ.Аханов  «Грамматика  теориясының  негіздері»  деген  еңбегінде  сөзге,  соның 

ішінде күрделі сөзге де тән және оны сөз тіркесінен ажырататын жалпылама белгілер делініп 

семантикалық тұтастық, морфологиялық тұтастық, синтаксистік тұтастық белгілері айтылып 

жүр дей келіп, күрделі сөздердің сөз тіркесінен айырмашылығын осы тұрғыдан сөз етеді. 

Басқа түркі тілдері сияқты, қазақ тілінде де күрделі сөздерді компоненттерінің бір-бірімен 

байланысу  тәсілі  тұрғысынан  әдетте  екіге  бөледі.  Құрамындағы  сыңарлары  сабақтаса 

байланысып  құрылғандарын  біріккен  сөзге,  ал  салаласа  байланысып  құрылғандарын  қос 

сөздерге жатқызады.  

Күрделі  сөздердің  арғы  тегі,  негізінен,  сөз тіркесі;  некен-саяқ  болмаса,  көпшілік  күрделі 

сөздерге негіз болған сөз тіркесін тауып, оны түсіндіруге болады.  

Нағыз  күрделі  сөздің  үлгісіне  –  бүгін,  биыл,  сексен,  сарала,  жарымжан,  көк  ала,  жақсы 

көру, еңбек ету, шығарып салу т.б. тәрізді сөздер жатады.  

Жалаң сөздер сияқты да сыртқы пішін, ішкі мән-мағына, яғни бірден көзге түсіп, көңілге 

қонатын  құрылым  болады.  Ол  оны  құрастырушы  компоненттердің  тұлғалық,  мағыналық 

бірлігінен тұрады.  

Тарихи  тұрғыдан  алып  қарағанда  күрделі  сөздердің  арғы  тегі,  негізінен,  сөздердің  еркін 

тіркесі  болады  дедік.  Осы  грамматикалық  категорияға  жататын  күрделі  сөздердің  пайда 

болуы,  әрине  кездейсоқ,  өзінен-өзі  бола  қалатын  жай  емес;  күрделі  және  белгілі  бір 

заңдылықтарға  негізделетін,  соның  нәтижесінде  пайда  болатын  құбылыс  болмақ.  Ондай 

заңдылықтардың  бірі  тілдік  дыбыс  жүйесі,  екіншісі  лексикасы,  үшіншісі  грамматикасына 

келіп саяды.  

Күрледі  сөз  деп  екі  я  одан  да  артық  сөз  тізбегінен  құралып,  лексика,  лексикалық-

грамматикалық  мағыналары  мен  тұлға,  сөйлемдегі  қызметі  жағынан  бөлшектенбей, 

тұтасымен белгілі бір ұғымның атауы ретінде жұмсалатын сөздерді айтамыз [3].  

Күрделі  сөздер  екі  не  одан  да  көп  сыңарлардан  жасалады.  Сондықтан  күрделі  сөздердің 

негізгі  белгісінің  біріне  оның  күрделі  құрылымы  жатады,  сол  арқылы  ол  дара  сөздерден 

ерекшеленеді. Мысалы, ата-ана, елтаңба, елбасы, таң намаз, шұбар ала, ой-пікір, тоқсан жеті, 

теміржол, күні бүгін, майшабақ т.б [2].  

 

2. Қазақ күрделі сөздерінің түрлері  

Күрделі  сөздер  жасалу  жолына  қарай  кіріккен  сөздер,  біріккен  сөздер,  қос  сөздер, 

қысқарған сөздер, тіркесті сөздер болып бөлінеді.  Кіріккен  сөз.  Қазақ  тіліндегі  кіріккен  сөздерге  бәйшешек,  белбеу,  қонағасы,  қолқанат, 

бүгін, биыл, сексен, қарлығаш және т.б. сөздер жатады. Мәселен, белбеу – белге буынатын 254 

 

бау, сексен – сегіз он, бүгін – бұл жыл, қоян – қой сияқты аң т.б.  дені екі, ал былтыр (бір жыл  дүр)  үш  сөздің  тіркесінен  пайда  болған.  Тіл  мамандарының  қай-қайсысы  болмасын 

кіріккен  сөздерге  компоненттері  дыбыстық  өзгеріске  ұшырау  салдарынан  бастапқы  түр-

тұрпатын өзгерткен сөздерді жатқызады [3].  

Енді  кіріккен  сөздердің  құрылымдық  сипатының  әуел  бастағы  қалпынан  өзгеше  болып 

қалыптасуына  ұйтқы  болған  тілдік  заңдылықтарға  тоқталайық.  Тіл  мамандарының 

көрсетулеріндей,  мәселен,  бәйшешек,  бәйтерек  сөздерінің  құрамындағы  бай  деген  элемент 

әуел  баста  бай  формасында  болғаны,  кейін  соңғы  компоненттердегі  жіңішке  дауысты 

дыбыстардың  ықпалынан  «а»  фонемасы  «ә»  фонемасына  айналып,  бүтін  сөз  бәйшешек, 

бәйтерек  болып  кеткені  мәлім;  Демек,  бәйшешек,  бәйтерек,  белбеу  тәрізді  сөздердің 

бастапқы тұлғасын өзгертіп қалыптасуына үндестік заңы ұйтқы болған [3].  Біріккен сөз. Күрделі сөздердің бір түрі – біріккен сөздер. Біріккен сөздердің екі түбірден 

бірігіп, жаңа бір ұғым тудыратынын айту оңай, ал біріккен сөздерді сөз тіркесінен ажыратып 

алу, олардың шегін айқындау оңай емес. Олай дейтініміз, біріккен сөздер мен сөз тіркестері 

бір-бірімен  мағыналық  жақтан  да,  құрылымы,  құрамы  жағынан  да  ұқсас,  өзара  астарласып 

жатады.  Біріккен  сөздер  мен  тіркес  сөздердің  құрамын  ажыратудың  жолы  салыстыру  әдісі 

арқылы іске асырылады. Мысалы, ақсақал, Ақбозат, Темірқазық, соқыртеке, итмұрын деген 

сөздерді  бірге  жазып,әрқайсысының  мағыналарын  ажыратуда  олардың  синонимдерін 

жарыстыра айтып түсіндіру керек. Демек, ақсақал сөзі қарт, Ақбозат, Темірқазық жұлдыздың 

аты.  

Біріккен сөз бен күрделі сөз тіркестерінің арасындағы айырманы нақтылаған соң, біріккен сөздердің  кем  дегенде  екі  немесе  үш  түбірлі  сөздерден  бірігіп,  жаңа  бір  ұғым  тудыратыны 

белгілі болды [4]. Қос сөздер. Күрделі сөздердің бір түрі – қос сөздер.   

 

3. Қазақ күрделі сөздерін формалдау ережелері 

Күрделі  сөздер  жасалу  жолына  қарай  кіріккен  сөздер  (бүгін,  жаздыгүні,  биыл),  біріккен 

сөздер (баспасөз, елтаңба, елбасы, Темірқазық), қос сөздер (үлкен-кіші, аяқ-табақ), қысқарған 

сөздер (ЕҰУ, АҚШ, БҰҰ), тіркесті сөздер (таң намаз, қара торғай, қара көк, жүз бес) болып 

бөлінеді.  

Таңбалық  амалдардың  барлығы  «Компьютерлік  лингвистика»  деген  тiлдiң  құрамы  мен 

қасиеттерiн  зерттейтiн  ғылым  саласында  анықталған.  Таңбаларда  анықталған  амалдар 

арқылы таңбалық өрнектер құрастырылады. 

Таңбалық  өрнектерді  өңдеп  көрсету  үшін  таңбалық  амалдардың  ассоциативтікдистрибутивтік  және  басқа  заңдылықтары  пайдаланылады  /13/,  /14/,  /15/.  Осындай 

заңдылықтар берілген күрделі өрнектерді қарапайымдап, ондағы амалдар санын қысқартады 

және олардың орындалуын жеңілдетеді. Олардың практикадағы маңызы өте зор. 

Таңбаларда  берiлген  екi  таңбалық  тiзбеден  бiр  таңбалық  тізбе  құруға  мүмкiндiк  беретiн құрастыру амалдары анықталған. 

Күрделі  сөздердің жасалу  жолдарын компьютерлік лингвистика көмегімен формалдауды 

қарастырайық. Кез келген тілден таңба ретінде бөлінбейтін бірлік (фонема-дыбыс, графема-

әріп, цифр, тыныс белгісі, жақша және т.б.) немесе құрылымдық бірлік (морфема, лексема 

және  т.б.)  алынады.  Берiлген  таңбалармен  жұмыс  істеу  үшін  осы  таңбаларға  амалдар 

қолдану  керек.  Ал  амалдарды  қолдана  бiлу  үшiн  олардың  анықтамаларын,  белгiлерiн  және 

қасиеттерiн бiлу қажет. 

Таңбаларда  берiлген  екi  таңбалық  тiзбеден  бiр  таңбалық  тізбе  құруға  мүмкiндiк  беретiн құрастыру амалдары анықталған. 

Құрастыру амалдарының iшiнде ең қарапайымы – конкатенация (тiркеу) амалы. Егер бұл 

амалды  ‘

’  таңбасымен  белгiлесек,  онда  оны  берілген  екі  айнымалы  таңбалық  шамалар α

1

және α2

үшін былай анықтауға болады: α1

-дың мәнiнiң оң жағына α2

-нің мәнiн тiркегеннен 

кейiн   тiзбесi шығады және ол мына түрде жазылады α

1α2

=

.Осы айтылған ереже күрделі сөздердің жасалуына сәйкес келеді. Мысалы, егер α

1

– дың мәнi ‘ЕЛ’, ал α2

-нің мәнi ‘ТАҢБА’ 255 

 

болса,  онда   -ның  мәнi  ‘ЕЛТАҢБА’  болады.  Енді  күрделі  сөздің  қысқарған  сөздерден 

жасалатынын  өрнектеп  көрелік.  Бізде  α1α2α3

... 
α

n

=

болсын.  Мысалы,  α1

=  Е,  


α

2

= Ұ, α3

= У нәтиже α1α2α3

=ЕҰУ. 


Мұндағы α

11α12α13

 ... 
α

1n 

= α

1,   

α

21α22α23

...
α

2n 

= α

2,   

α

31 α32α33

... 
α

3n  

= αα

11 

=Е, α12 

=У, α13 

=Р, α14 

=А, ... α1n 

=Я 


α

21 

=Ұ, α22 

=Л, α23 

=Т, α24 

=Т, ... α2n 

=Қ 


α

31 

=У, α32 

=Н, α33 

=И, α34 

=В, ... α3n 

=І 


Е

УРА

ЗИЯ  Ұ

ЛТТ

ЫҚ У

НИВ

ЕРС

ИТЕ

ТІ=ЕУРАЗИЯ 

ҰЛТТЫҚ 

УНИВЕРСИТЕТІ. Мұндағы   – кетікті көрсетеді, яғни сөздердің бөлек жазылатынын бірақ бір мағына білдіретінін көрсетеді. 

Егер  α1

=  ҚАРА,    α2

=  КӨК  болса,  онда 

=  α

1α2

=  ҚАРА
КӨК  деген  таңбалық  өрнек 

шығады. Бұл өрнек бізде сөздердің тіркесу арқылы жасалуын сипаттайды. 

Енді  қазақ  күрделі  сөздеріне  байланысты  ереже  жасап,  оны  жақшалық  әдіс  көмегімен 

формалдауды қарастырайық. Келісім: Алдымен әріптерді бір жүйеге келтіріп, төмендегідей етіп белгілеп алайық.  

АОҰЫЭ!01 

ӘӨҮIЕЯИЮ!02 

МНҢ!03 //жуан әріпке бітетіндік 

МНҢ!04 // жіңішке 

РУЙ!05 


РУЙ!06 

Л!07 


Л!08 

БГҒД!09 


БГҒД!10 

ЖЗ!11 


ЖЗ!12 

П!13 


П!14 

К!15 


К!16 

Қ!17 


СТШ!18 

СТШ!19 


Ереже  1.  Дауысты  дыбыстан  басталатын  сын  есімнің  алдыңғы  әрпіне  п  –  дауыссызын 

жалғау арқылы күрделі сөз жасауға болады. Жоғарыдағы келісім бойынша: 

01X! ((01п)-X) - ап-аласа 

01X! ((01п)-X) - ап-алыс 

01X! ((01п)-X) - ап-аласа 

01X! ((01п)-X) - ап-арық 

01X! ((01п)-X) - ап-ащы 

01X! ((01п)-X) - оп-оңай 

01X! ((01п)-X) - ұп-ұзын 

01X! ((01п)-X) - ып-ыстық 

02X! ((02п)-X) - әп-әдемі 

02X! ((02п)-X) - үп-үлкен 

02X! ((02п)-X) - өп-өңді 

02X! ((02п)-X) - еп-ерсі Ереже  2.  Дауыссыз  дыбыстан  басталатын  сын  есімнің  алдыңғы  екі  әрпінен  кейін  п  – 

дауыссызын жалғау арқылы күрделі сөз жасауға болады.  

Жоғарыдағы келісім бойынша: 

0301X! ((0301п)-X) - моп-момын 

0301X! ((0301п)-X) - нып-нығыз 

0402X! ((0402п)-X) - мөп-мөлдір 

0402X! ((0402п)-X) - нәп-нәзік 

0901X! ((0901п)-X) - боп-бос 

0901X! ((0901п)-X) - боп-боз 

0901X! ((0901п)-X) – дап-дайын 

0901X! ((0901п)-X) - доп-домалақ 

1002X! ((1002п)-X) - біп-биік 256 

 

1002X! ((1002п)-X) - бөп-бөтен 1002X! ((1002п)-X) - бөп-бөлек 

1002X! ((1002п)-X) - дәп-дәл 

1002X! ((1002п)-X) - дөп-дөңгелек 

1101X! ((1101п)-X) - жап-жасыл 

1101X! ((1101п)-X) - жап-жақсы 

1101X! ((1101п)-X) - жып-жылы 

1101X! ((1101п)-X) - жұп-жұмсақ 

1101X! ((1101п)-X) - жап-жаңа 

1101X! ((1101п)-X) - жап-жақын 

1202X! ((1202п)-X) - жіп-жіңішке 

1202X! ((1202п)-X) - жеп-жеңіл 

1602X! ((1602п)-X) - көп-көрім 

1602X! ((1602п)-X) - кәп-кәрі 

1602X! ((1602п)-X) - кәп-кәрі 

1701X! ((1701п)-X) - қап-қара 

1701X! ((1701п)-X) - қып-қызыл 

1701X! ((1701п)-X) - қап-қатты 

1701X! ((1701п)-X) - қоп-қою 

1701X! ((1701п)-X) - қоп-қоңыр 

1801X! ((1801п)-X) - cап-сары 

1801X! ((1801п)-X) - cұп-сұры 

1801X! ((1801п)-X) - шып-шымыр 

1801X! ((1801п)-X) - шұп-шұбар 

1902X! ((1902п)-X) - cеп-семіз 

1902X! ((1902п)-X) - тәп-тәтті 

1902X! ((1902п)-X) - тәп-тәуір 

1902X! ((1902п)-X) - түп-түзу 

Ереже 3. Жалаң сөздің қайталануынан күрделі сөз (қайталама қос сөз) жасауға болады.  

X! ((Х)-X) - арбаң-арбаң 

X! ((Х)-X) - әрең-әрең 

X! ((Х)-X) - бір-бір 

X! ((Х)-X) - биік-биік 

X! ((Х)-X) - белес-белес 

X! ((Х)-X) - қап-қап 

X! ((Х)-X) - мая-мая 

X! ((Х)-X) - гүрс-гүрс 

X! ((Х)-X) - тал-тал 

X! ((Х)-X) - сылқ-сылқ  

X! ((Х)-X) - тез-тез  

X! ((Х)-X) - ербең-ербең 

X! ((Х)-X) - күрс-күрс 

X! ((Х)-X) - қарын-қарын 

X! ((Х)-X) - тау-тау 

X! ((Х)-X) - бәрі-бәрі 

X! ((Х)-X) - қандай-қандай 

X! ((Х)-X) - қалай-қалай 

X! ((Х)-X) - не-не Ереже  4.  Бұйрық  райлы  етістікке  қосымшасын  (етістікке  -а,  -е,  -й  көсемше  жұрнағын 

жалғау арқылы) сөздің қайталануынан күрделі сөз (қайталама қос сөз) жасауға болады.  

((X06))! (((X06)е)-X06(е))- Көре-көре 

((X06))! (((X06)е)-X06(е))-жүре-жүре 

((X05))! (((X05)а)-X05(а))- бара-бара 

((X02))! (((X02)е)-X02(е))-билей-билей 

((X06))! (((X06)е)-X06(е))-жүгіре-жүгіре 

((X05))! (((X05)а)-X05(а)) - тұра-тұра  

((X08))! (((X08)е)-X08(е)) - күле-күле 

((X08))! (((X08)е)-X08(е)) - біле-біле 

((X02))! (((X02)е)-X02(е))-сөйлей-сөйлей 

Ереже  5.  Жалаң  сөзді  қайталау  арқылы  және  оның  алдыңғы  сыңарына  

-па, -пе, -та, -те, -ма, -ме, -ба, -бе, -да, -де, қосымшасын жалғау арқылы күрделі сөз жасауға 257 

 

болады. Егер сөз қатаң дауыссызға аяқталса онда -па, -пе, ұяң дауыссызға аяқталса  -ба, -бе, үнді дауыссызына аяқталса -ма, -ме, -да, -де қосымшалары жалғанады.  

((X19))! (((X19)пе)-X) - бетпе-бет 

((X06))! (((X06)де)-X) - бірде-бір 

((X11))! (((X11)ба)-X)–ауызба-ауыз 

((X12))! (((X12)бе)-X) - жүзбе-жүз 

((X07))! (((X07)ма)-X) - жолма-жол 

 

((X07))! (((X07)ма)-X) - қолма-қол ((X08))! (((X08)ме)-X) – дәлме-дәл 

((X04))! (((X04)де)-X) - кімде-кім Ереже 6. Екі сөздің бірігуі арқылы және бастапқы компонент дауыстыға аяқталып, соңғы 

компонент  дауысты  фонемадан  болғандықтан,  бастапқы  сөздің  соңғы  дауысты  дыбысы 

ығысып шығып қалуы арқылы күрделі сөз жасауға болады.  ХХ

Х

У

У

У

2

12

1

 Жүйені қосу тәсілімен шешетін болсақ: 

Х

У

Х

Х

У

У

2

1

21

 

Мұндағы 2

У 

1

Х - дауысты дыбыстар.  

Енді  

Алма+аты=Алматы ала+аяқ=алаяқ 

алты+атар=алтатар 

бие+емшек=биемшек 

Қара+аспан= Қараспан 

қара+ала=қарала 

Қанды+ағаш=Қандағаш 

сапты+аяқ=cаптаяқ 

сары+ала=сарала 

сары+ағаш=cарағаш 

шыны+аяқ=шынаяқ 

өлі+ара=өлара 

жалма+ауыз=жалмауыз 

құла+ала=құлала 

Мақта+арал=Мақтарал 

Қазақ  күрделі  сөздерін  формалдау  ережелері  бізге  күрделі  сөздерін  автомат  түрінде 

шығару мүмкіндік береді:

 

 

 Сурет 1. Ережелер терезесі 

258 

 

Жұмысты жалғастыру үшін «Сөзді енгізіңіз» өрісіне «Ереже 1» - ге сәйкес өзімізге қажетті сөзді енгіземіз (Сурет 2). 

 

  

Сурет 2. Ереже 1  

 

Жоғарыда көріп тұрғандай, «әдемі» сөзін енгізген соң құрау батырмасын басамыз. Сонда бізге ол автоматты түрде «Ереже 1» - ге сәйкес күрделі сөзді жасап береді.  

 

Әдебиеттер 

1

 

www.egemen.kz/?p=3486 

2

 Жанпейісов Е., Хұсайын К. және т. б. Қазақ грамматикасы. Фонетика, сөзжасам, 

морфология, синтаксис. – Астана: Астана, 2002. 152б. 

3

 

Шәкенов Ж. Қазақ тіліндегі күрделі сөздер мен күрделі тұлғалар. – Алматы: Ана тілі, 1991, Б. 3-20 

4

 Аханов К., Б.Кәтенбаева , Әбдіғалиева Т. Қазақ тілі оқулығының методикалық 

нұсқауы. Алматы: Рауан, 1990, Б. 19-27

 

 

 

Г.Т. БЕКМАНОВА, Л. ЖЕТКЕНБАЙ 

 

 

Л.Н. Гумилев атындағы Еуразия ұлттық университеті, 

«Жасанды зерде» ҒЗИ, Астана, Қазақстан 

 

 

ҚАЗАҚ КҮРДЕЛІ СӨЗДЕРІН ТҮРЛЕНДІРУДІҢ СЕМАНТИКАЛЫҚ МОДЕЛІ 

 

1 

Қазақ күрделі сөздерінің семантикалық базасын құру  

Семантикалық  белгілер  ретінде  күрделі  сөз,  күрделі  сөздердің  түрлері,  сөз  таптары  алынады.  

 

Каталог: jspui -> bitstream -> ICT
ICT -> Атты І халықаралық конференция ЕҢбектері
ICT -> Ф. Р. Гусманова, Б. А. Урмашев, М. Ж. Сақыпбекова
ICT -> Атты І халықаралық конференция ЕҢбектері
ICT -> Республикасы білім жəне ғылым министрлігі
ICT -> Программасы сөйлемдердің құрылымын, сөздің мағынасын ескере отырып түсінікті аударма
ICT -> V международная научно-практическая конференция «Информатизация общества 2016»
ICT -> 46-шы ғылыми-әдiстемелiк конференция материалдары
ICT -> Атты І халықаралық конференция ЕҢбектері


Поделитесь с Вашими друзьями:


©emirsaba.org 2019
әкімшілігінің қараңыз

    Басты бет