Атты І халықаралық конференция ЕҢбектері



Pdf көрінісі
бет23/39
Дата25.12.2016
өлшемі8,57 Mb.
#403
1   ...   19   20   21   22   23   24   25   26   ...   39

Әдебиеттер 
1.
 
Баскаков 
Н. 
А. 
Хасенова 
А.К. 
Исенгалиева 
И.А. 
Кордабаев 
Т.Р 
Сопоставительная  грамматика  русского  и  казахского  языков.  Морфология.  Изд-во 
"Наука",1966.  
2.
 
Введение в теорию многозначных отображений. Составитель Гельман Б.Д., Воронеж, 
2003. 
3.
 
Tomasz  Kaczynski,  Multivalued  Maps  As  a  Tool  in  Modeling  and  Rigorous  Numerics. 
Departement de mathematiques,Universite de Sherbrooke, 2008. 
 
4.
 
Teruko Mitamura, Eric H. Nyberg,  Hierarchical lexical structure and interpretive mapping 
in machine translation, Proceedings of International Conference COLING- 1992 Nantes, 1254-1258 
pp. 
 
5.
 
Dilek  Zeynep  Hakkani,  G¨okhan  T¨ur,  Kemal  Oflazer,  Teruko  Mitamura,  and  Eric  H. 
Nyberg, An English-to-Turkish Interlingual MT System,   Proceedings of International Conference 
AMTA-1998,  pp. 83-94. 
 
 
Г.Т. БЕКМАНОВА, А. МАХИМОВ 
 
 
Евразийский национальный университет им. Л.Н. Гумилева 
Институт искусственного интеллекта 
 
 
ГРАФЕМАТИЧЕСКИЙ И МОРФОЛОГИЧЕСКИЙ АНАЛИЗАТОР  
КАЗАХСКОГО ЯЗЫКА 
 
Автоматическая  обработка  текстов  естественного  языка  является  одним  из  актуальных 
направлений  развития  искусственного  интеллекта  и  информатики  в  целом,  так  как 
результаты в этом направлении позволит решить проблему создания средств эффективного 
речевого взаимодействия человека с компьютером. Исследованием этой проблемы уже более 
50  лет  занимаются  специалисты  нескольких  научных  областей.  С  развитием    современных 
естественно-языковых  технологий  появилась  принципиальная  возможность  понимания 
естественно-языкового  текста,  то  есть  смысла  текста  компьютером.  Сегодня  можно  с 
уверенностью говорить о том, что в Казахстане развивается компьютерная лингвистика, что 
позволяет  надеяться  на  то,  что  в  скором  времени  будут  существовать  лингвистические 

197 
 
процессоры  –  компоненты,  составляющие  структуру  систем  анализа  текстов,  которые 
последовательно  обрабатывают  входной  текст.  Вход  одного  процессора  является  выходом 
другого[1]. 
Выделяются следующие компоненты: 
• графематический анализ — выделение слов, цифровых комплексов, формул и т.д.; 
• морфологический анализ — построение морфологической интерпретации слов входного 
текста; 
• синтаксический анализ — построение дерева зависимостей всего предложения; 
• семантический анализ — построение семантического графа текста. 
 
По  результатам  работы  графематического  анализатора  при  анализе  повести  «Көксерек» 
М. Ауезова были получены следующие результаты: 
 
Количество абзацев: 231 
Количество предложений: 871 
Количество слов: 7396 
Предложений длины 1: 4 
Предложений длины 2: 32 
Предложений длины 3: 58 
Предложений длины 4: 75 
Предложений длины 5: 92 
Предложений длины 6: 80 
Предложений длины 7: 85 
 
Предложений длины 8: 76 
Предложений длины 9: 72 
Предложений длины 10: 50 
Предложений длины 11: 55 
Предложений длины 12: 45 
Предложений длины 13: 27 
Предложений длины 14: 26 
Предложений длины 15: 22 
Предложений длины 16: 11 
Предложений длины 17: 14 
Предложений длины 18: 11 
 
Предложений длины 19: 10 
Предложений длины 20: 11  
Предложений длины 21: 6 
Предложений длины 22: 2 
Предложений длины 23: 1 
Предложений длины 24: 1 
Предложений длины 25: 1 
Предложений длины 26: 1 
Предложений длины 27: 2 
Предложений длины 29:1 
Данная статистика необходима для построения семантической модели текста. Поскольку 
можно  предположить,  что  предложения  длиной  (под  длиной  предложения  понимается 
количество слов в нем) меньше 4 слов является простым. А предложение длиной больше или 
равное 4 может не являться простым. Это простейшая проверка позволит не анализировать 
синтаксическим  анализатором  короткие    предложения,  что  экономит  время  работы 
алгоритма. 
Морфологический  анализ  казахских  текстов  –  это  задача  обратная  генерации  (синтезу) 
словоформ  и  новых  слов.  Под  словоформами  понимаются  измененные  с  помощью 
окончаний  по  падежам,  числам,  лицам  и  т.д.  слова  (флексии),  под  новыми  словами 
понимаются слова, несущие новую смысловую нагрузку, образованные путем прибавления в 
суффиксов  и  т.д.  Таким  образом,  при  разработке  морфологического  анализатора  был 
разработан  морфологический  синтезатор  казахских  слов,  основанный  на  формальных 
правилах.  
Морфологический  синтез  слов  осуществляется  с  помощью  эмулятора  нейронной  сети, 
который генерирует все словоформы на основе формальных правил (рисунок 1). 
 
 
Рисунок 1. Процесс словоизменения 
База знаний 
Анализ 
Начальная 
форма слова 
 
Семантические признаки 
Словоизменение 
 
Словообразован
ие 
Словарь 
словоформ 

198 
 
Процесс  словоизменения  и  словообразования  основывается  на  детальном  анализе 
начальной  формы  слова  с  целью  выделения  его  морфологических  признаков  и  считывания 
его  семантических    признаков  из    базы  знаний.  Далее  определяется  траектория 
словоизменения,  происходит  сам  процесс  словоизменения  на  основе  семантической 
нейронной  сети  и  запись  словоформы  и  его  морфологической  информации  в  словарь 
словоформ.  В  таблице  1  приведен  пример  словоизменения  существительного  «iзбасар». 
Фрагмент  формальных  правил  словоизменения  на  примере  существительного  с  учетом 
закона сингармонизма, который обуславливает добавления мягких или твердых окончаний в 
зависимости  от  мягкости  или  твердости  основы.  Данные  формальные  правила  содержат  и 
семантические категории. 
Приведенный  пример  показывает  фрагмент  правил,    где  «зе»  –  зат  есім  (имя 
существительное), «жа» - жанды (одушевленность), «01» заканчивается на твердые гласные 
а, о, ұ, «))»  между закрывающими скобками помещены окончания существительных, после 
«!» морфологическая информация[2]. 
 
Таблица 1. Словоизменение одушевленного существительного «iзбасар»  
Словоформа 
МИ 
Словоформа 
МИ 
iзбасар 
зежа 
iзбасарымыздың 
зежа#тә11іл 
iзбасармын 
зежа#жі11 
iзбасарымызға 
зежа#тә11ба 
iзбасармыз 
зежа#жі11 
iзбасарымызды 
зежа#тә11та 
iзбасарсың 
зежа#жі22 
iзбасарымызда 
зежа#тә11жс 
iзбасарсыңдар 
зежа#жі22 
iзбасарымыздан 
зежа#тә11шы 
iзбасар 
зежа#жі33 
iзбасарымызбен 
зежа#тә11кө 
iзбасарым 
зежа#тә11 
iзбасарымызбенен 
зежа#тә11кө 
iзбасарымыз 
зежа#тә11 
iзбасарыңның 
зежа#тә22іл 
iзбасарың 
зежа#тә22 
iзбасарыңа 
зежа#тә22ба 
iзбасарыңыз 
зежа#тә22 
iзбасарыңды 
зежа#тә22та 
iзбасары 
зежа#тә33 
iзбасарыңда 
зежа#тә22жс 
iзбасарлар 
зежа#кт 
iзбасарыңнан 
зежа#тә22шы 
iзбасарлармыз 
зежа#ктжі11 
iзбасарыңмен 
зежа#тә22кө 
iзбасарларсыңдар 
зежа#ктжі22 
iзбасарыңменен 
зежа#тә22кө 
iзбасарлар 
зежа#ктжі33 
iзбасарыңыздың 
зежа#тә22іл 
iзбасарларым 
зежа#кттә11 
iзбасарыңызға 
зежа#тә22ба 
iзбасарларымыз 
зежа#кттә11 
iзбасарыңызды 
зежа#тә22та 
iзбасарларың 
зежа#кттә22 
iзбасарыңызда 
зежа#тә22жс 
iзбасарларыңыз 
зежа#кттә22 
iзбасарыңыздан 
зежа#тә22шы 
iзбасарлары 
зежа#кттә33 
iзбасарыңызбен 
зежа#тә22кө 
iзбасар 
зежа#ат0 
iзбасарыңызбенен 
зежа#тә22кө 
iзбасардың 
зежа#іл 
iзбасарлардың 
зежа#ктіл 
iзбасарға 
зежа#ба 
iзбасарларға 
зежа#ктба 
iзбасарды 
зежа#та 
iзбасарларды 
зежа#ктта 
iзбасарда 
зежа#жс 
iзбасарларда 
зежа#ктжс 
iзбасардан 
зежа#шы 
iзбасарлардан 
зежа#ктшы 
iзбасармен 
зежа#кө 
iзбасарлармен 
зежа#кткө 
iзбасарменен 
зежа#кө 
iзбасарларменен 
зежа#кткө 
iзбасарымның 
зежа#тә11іл 
iзбасарларымның 
зежа#кттә11іл 
iзбасарыма 
зежа#тә11ба 
iзбасарларыма 
зежа#кттә11ба 
iзбасарымды 
зежа#тә11та 
iзбасарларымды 
зежа#кттә11та 
iзбасарымда 
зежа#тә11жс 
iзбасарларымда 
зежа#кттә11жс 
iзбасарымнан 
зежа#тә11шы 
iзбасарларымнан 
зежа#кттә11шы 
iзбасарыммен 
зежа#тә11кө 
iзбасарларыммен 
зежа#кттә11кө 

199 
 
iзбасарымменен 
зежа#тә11кө 
iзбасарларымменен 
зежа#кттә11кө 
iзбасарларыңның 
зежа#кттә22іл 
iзбасарларымыздың 
зежа#кттә11іл 
iзбасарларыңа 
зежа#кттә22ба 
iзбасарларымызға 
зежа#кттә11ба 
iзбасарларыңды 
зежа#кттә22та 
iзбасарларымызды 
зежа#кттә11та 
iзбасарларыңда 
зежа#кттә22жс 
iзбасарларымызда 
зежа#кттә11жс 
iзбасарларыңнан 
зежа#кттә22шы 
iзбасарларымыздан 
зежа#кттә11шы 
iзбасарларыңмен 
зежа#кттә22кө 
iзбасарларымызбен 
зежа#кттә11кө 
iзбасарларыңменен 
зежа#кттә22кө 
iзбасарларымызбенен  зежа#кттә11кө 
iзбасарларыңыздың  зежа#кттә22іл 
iзбасарларыңыздан 
зежа#кттә22шы 
iзбасарларыңызға 
зежа#кттә22ба 
iзбасарларыңызбен 
зежа#кттә22кө 
iзбасарларыңызды 
зежа#кттә22та 
iзбасарларыңызбенен  зежа#кттә22кө 
iзбасарларыңызда 
зежа#кттә22жс 
iзбасарларымсыңдар  зежа#кттә11жі22 
iзбасарларысыңдар 
зежа#кттә33жі22  iзбасарларыңбыз 
зежа#кттә22жі11 
 
Казахский  язык,  относящийся  к  группе  тюркских  языков,  очень  хорошо  поддается 
формализации.    Далее  существует  три  алгоритма  работы  морфологического  анализатора: 
декларативный, процедурный, комбинированный.  
Декларативный метод[3,4].  При таком методе реализации морфологического анализа в 
словаре  хранятся  все  возможные  словоформы  каждого  слова  и  соответствующая  им 
морфологическая информация. В этом случае задача морфологического анализа заключается 
в поиске словоформы в словаре и переписывании из словаря морфологической информации. 
Так  как  количество  различных  словоформ  каждого  слова  довольно  велико,  декларативный 
метод  требует  значительных  затрат  памяти  вычислительной  системы,  что  сопровождается 
рядом трудностей, связанных с созданием и поддержкой словаря, а также с избыточностью 
информации. К достоинствам данного метода следует отнести высокую скорость анализа и 
универсальность по отношению к множеству всех возможных словоформ. 
Для  эффективного  поиска,  по  словарю  словоформ,  который  в  данное  время  содержит 
более  2 800 000  словарных  статей,  было  построено  в  некоторых  вариантах  анализатора  – 
дерево, в других использовалась хеш-функция.  
Процедурный  метод  предполагает  предварительную  систематизацию  морфологических 
знаний  о  естественном  языке  и  разработку  алгоритмов  присвоения  морфологической 
информации  отдельной  словоформе[3,4].  Процедурный  морфологический  анализатор  
состоит из следующих этапов: выделение в текущей словоформе основы, ее идентификация, 
приписывание  словоформе  соответствующего  перечня  морфологической  информации.  К 
недостаткам  этого  метода  относятся  высокая  трудоемкость  составления  словарей 
совместимости,  что  является  трудно  решаемой  и  не  автоматизируемой  полностью  задачей 
для  языков,  которым  свойственно  большое  число  слов-исключений.  Реализация  данного 
способа  занимает  значительно  меньший  объем  памяти,  но  при  этом  увеличивается  время 
морфологического  анализа  за  счет  разбиения  словоформы  на  составляющие  и  применения 
процедур совместимости [4].  
При  использовании    процедурного  метода  алгоритм  морфологического  анализа 
значительно  усложняется.  Дело  в  том,  что,  например,  для  существительных  личное 
окончание первого лица «-м» входит в другие окончания «-мін»,  «-міз» и другие.    
Рассмотрим пример для слова «бала - ребенок» (лемма) и двух его словоформ «баламның 
-  моего  ребенка»,    «баламын  -  я  ребенок».  В  первом  случае  к  основе  присоединены  два 
окончания  личное  окончание  первого  лица  «-м»  и  падежное  окончание  «-ның».  Во  втором 
случае к основе добавлено одно личное окончание первого лица  «-мын».  Алгоритм поиска 
должен  предусматривать  любое  возможное  количество  присоединенных  окончаний    и 
накопление  морфологической информации. Ниже будет построен алгоритм поиска слова и 
его морфологической информации[81,82,83]:  
1. Слово считывается;  

200 
 
2. Открывается словарь начальных форм  и в нем выполняется поиск  считанного слова;  
3. Если слово найдено, то перейти к шагу 8, иначе шаг 4 ; 
4.    Слово  в  цикле  посимвольно  считывается,  начиная  с  последнего  символа,  то,  что 
получается, ищем в словаре окончаний; 
5. Если окончание найдено, то остаток ищем в словаре начальных форм; 
6. Запоминаем  морфологическую информацию слова; 
7. Если такое слово не найдено, то переходим к шагу 4, иначе к шагу 8 ;  
8. Конец. 
Комбинированный  метод.  В  системах  реальной  степени  сложности  чаще  используется 
комбинированный  вариант  морфологического  анализа.  При  этом  используется  как  словарь 
словоформ, так и словарь основ. На первом этапе проводится поиск по словарю словоформ, 
как при декларативном методе, и в случае успешного поиска анализ на этом завершается. В 
противном случае задействуется словарь основ и процедурный метод анализа. 
На рисунке приведен пример работающего приложения морфологического анализатора на 
основе комбинированного метода.
 
 
 
 
Рисунок 2. Окно морфологического анализатора 
 

201 
 
За  несколько  лет  работы  совместно  со  студентами  и  магистрантами  над  различными 
модификациями морфологического анализатора казахского языка, можно сделать вывод, что 
в  основе  наиболее  эффективного  анализатора  должен  лежать  именно  комбинированный 
метод  его  построения.  Поскольку  в  базе  данных  начальных  форм  слов  находится  около  50 
тысяч  начальных  форм  слов,  из  которых  сгенерировано  более  3  миллионов  словарных 
статей, то в случае работы декларативного метода такое количество является недостаточным 
для  эффективной  работы  морфологического  анализатора.  Смею  предположить,  что  для 
эффективной работы такого метода необходимо 150 тысяч начальных форм слов и около 9 
миллионов словарных статей. В сложившейся ситуации  комбинированный метод позволяет 
построить эффективный анализатор около 90%, остальные 10% ошибок можно устранить за 
счет  пополнения  базы  данных  начальных  форм  слов.  Данные  ошибки  неизбежны  из-за 
вхождений  последовательностей  символов  окончаний  и  суффиксов  друг  в  друга,  когда  их 
невозможно развести явно по семантическим признакам.   
 
Литература 
1.
 
А.А. Дунаев. Исследовательская система для анализа текстов на естественном языке 
2.
 
Зализняк  А.А.  Грамматический  словарь  русского  языка.  Словоизменение  −  М.: 
Русский язык, 1980. − 880 с. 
3.
 
Добрушина  Е.Р.,  Савина  Г.Б.,  Гельбух  А.Ф.  Система  точного  морфологического 
анализа  и  синтеза  //  Программное  обеспечение  новой  информационной  технологии.  − 
Калинин: НПО ЦПС, 1989. 
4.
 
Вороной  С.М.,  Егошина  А.А.    Повышение  эффективности  интеллектуального 
поиска  в  полнотекстовых  базах  данных  на  основе  автоматического  аннотирования 
документов.  VII  Международная  конференция  «Интеллектуальный  анализ  информации 
ИАИ-2007».: Киев, 15-18 мая 2007 г.: Сб. тр.//Рос.ассоц.искусств.интеллекта и др.; Под ред. 
Т.А. Таран. – К.:Просвіта, 2007. –392 с.  
 
 
А.С. МУКАНОВА, Б.Ж. ЕРГЕШ, РАЗАХОВА Б.Ш. 
 
 
Л.Н. Гумилев атындағы Еуразия ұлттық университеті, Астана, Қазақстан 
 
 
МОРФОЛОГИЯЛЫҚ ЕРЕЖЕЛЕРДІҢ ОНТОЛОГИЯЛЫҚ ЕРЕЖЕЛЕРІ 
 
Бұл  жұмыста  қазақ  тілінің  морфологиялық  ережелерінің  онтологиялық  модельдері 
көрметілген. 
Кілттік сөздер: онтология, морфологиялық ережелер, семантикалық гиперграф.  
 
Қазіргі кезде табиғи тілді өңдеу процестерінде қиындық тудыратын жағдай ол формалдау 
болып  табылады.  Сөзді  тудыруды  қандай  да  бір  белгіленген  траектория  бойынша  жүзеге 
асыру  қиын,  себебі,  сөзден  жаңа  сөз  тудыру  оның  бастапқы  түбірінің  мағынасына 
байлынысты  болады.  Сондықтан  да  білімді  ұсынудың  формалды  құралын  таңдау  қажет. 
Білімді  ұсынудың  формалды  құралының  бірі  ретінде  семантикалық  гиперграфты  алуға 
болады.  Семантикалық  гиперграф  семантикалық  желінің  кеңейтілген  түрі,  онда  n-арлы 
қарым-  қатынас  көрсетілген,  сол  себепті  де  семантикалық  гиперграф  арқылы  объектінің 
атрибуттарын  ғана  емес,  сонымен  қатар,  олардың  құрылымын,  «бүтіндік»  бейнеленуін 
көрсетуге болады[1,2]. 
H гиперграфы (VR) жұбымен анықталады, мұндағы V= { } – төбелер жиыны; R= { } – 
қабырғалар жиыны;= 1, 2, …, n;= 1, 2, ..., m; әрбір қабырға келесі жиыннан тұрады V, яғни, 
, j
s

j
t
, s, t – натуралды сандар. 

202 
 
Онтология түсінігі  грек тілінен аударғанда онтос – жан,мән,мағына, логос -  білім дегенді 
білдіреді, яғни болмысты зерттейтін философиялық ілім. 
Техникалық  ғылымдарда  онтологияның  қолданылуының  негізгі  мәні    белгілі  бір  білім 
облысы  бойынша  мәліметтер  жиынының  барлығын  қамтитын  және  бөліктік 
формализацияны  концептуальді  сызбамен  көрсетуі.  Концептуальды  сызба  негізінде 
түсініктер жиыны + түсініктер жайлы мәліметтер (қасиет, қатынас, шектеу, аксиомалар және 
түсініктердің  бекітілуі,  бұл  ақпараттардың  барлығы  таңдалынған  пәндік  облыс  бойынша  
есептің шешілу процесін сипаттау үшін қажет) беріледі. 
Компьютерлік лингвистикамен айналысатын мамандардың арасында онтологияның нақты 
тұрақталынған  (классикалық)  анықтамасын  Губерт  ұсынды:  онтология  –  бұл  
концептуализацияның эксплицитті спецификациясы, мұнда концептуализация ретінде пәндік 
облыстың  объекттерінің  жиындары  мен  олардың  арасындағы  байланыстардың  сипатталуы 
түсініледі.  
Қазақ  тілінің  морфологиялық  ережелерінің  онтологиялық  модельдері  онтологияны 
құрудың негізгі ережелеріне сай құрылады, бірақ та білімді ұсыну тілі ретінде семантикалық 
гиперграф  алынады.  Осы  формализм  онтологияны  семантикалық  гиперграф  түрінде 
бейнелеуге мүмкіндік береді:  О (X, R, I), мұндағы X  – пәндік облыс түсініктерінің  жиыны 
(гиперграф  төбесі),  R  –  түсініктер  арасындағы  қарым-  қатынастар  жиыны  (гиперграф 
доғалары мен қабырғалары), ал I – осы пәндік облыстағы түсініктер мен қарым- қатынастар 
аттарының жиыны. 
Семантикалық  гиперграф  арқылы  түбір  сөздерге  жалғаулар  мен  жұрнақтарды  қосу 
ережелері  формалданады.  Гиперграфтар  негізінен  алғанда  көп  өлшемді  құрылым  болып 
табылады.  Бірақ  көптеген  жағдайда  бір  өлшемді  құрылымдарды  пайдаланған  тиімді  болып 
жатады.  Сондықтан  да  көп  өлшемді  графтар  құрылымындағы  ақпараттың  бір  өлшемді 
құрылымға  өткені  біз  үшін  қажет.  Графтарды  бірөлшемді  құрылым  ретінде  бейнелеу  үшін 
сызықтық  жақшалық  жазбаларды  қолдануға  болады,  яғни,  гиперграфтарды  жолдар  түрінде 
бейнелеу [3]. Онда гиперграфтың төбелері ашылған және жабылған дөңгелек жақша түрінде 
бейнеленеді.  Гиперграфтар  мен  олардың  сызықтық  жақшалық  жазбалары  арасында  тығыз 
біртипті  өзара  байланыс  бар.  Сызықтық  жақшалық  жазба  қандай  да  бір  гиперграфты 
толықтай  тексеріп,  айналып  өткеннен  кейін  жасалынады.  Графтар  мысалы  және  оларға 
сәйкес келетін сызықтық жақшалық жазбалардың мысалдары сурет 1-де көрсетілген. 
 
 
 
Сурет 1. Сызықтық жақшалық жазба түрлері 
 
Қазақ  тілінде  9  сөз  табы  бар.  Олар:  зат  есім,  сын  есім,  сан  есім,  етістік,  есімдік,  үстеу, 
одағай,  шылау,  еліктеу  сөздер.  Төменде  осы  сөз  таптарының  онтологиялық  модельдері, 
сызықтық  жақшалық  жазба  арқылы  алынған  формалды  ережелер  көрсетіледі,  ол  ережелер 
қазақ тілінің сөздерін тудыру үшін қолданылады.  
Сурет 2-де зат есімнің онтологиялық моделі көрсетілген. 

203 
 
 
 
Сурет 2. Зат есімнің онтологиялық моделі 
 
Формалды ережелер төмендегідей болады: 
((зежа01))!ат0 
((зежа01)ның)!іл 
((зежа01)ға)!ба 
((зежа01)ны)!та 
(зат есім,жанды, 01 дауысты)! атау септік 
((зат есім,жанды, 01 дауысты)ның)! ілік септік 
((зат есім,жанды, 01 дауысты)ға)! барыс септік 
((зат есім,жанды, 01 дауысты)ны)! табыс септік 
 ((бала)) 
((бала)ның) 
((бала)ға) 
((бала)ны 
 
Сурет 3- те сын есімнің  онтологиялық моделі көрсетілген.  
 
 
Сурет 3. Сын есімнің онтологиялық моделі 
 
Сын есім үшін формалды ережелер:  
((сы011р)рақ)!сыса 
сын есім, дауысты, рақ жұрнақ  (ақылды)рақ – «умнее» 
((сы014л)лау)!сыса 
салыстырмалы шырай 
(ақылды)лау – «умнее» 
өте ақылды – «очень умный» 
((сы01)ның)!іл 
сын есім, ілік септік 
(ақылды)ның –  «умного» 
((сы01)мын)!жк11 
сын есім, І-жақ жіктік жалғау 
(ақылды)мын – «я умный» 
((сы01)сың)!жі22 
сын есім, ІІ-жақ жіктік жалғау  (ақылды)сың – «ты умный» 
 
Сурет 4- те сан есімнің онтологиялық моделі көрсетілген. 
 

204 
 
 
 
Сурет 4. Сан есімнің онтологиялық моделі 
 
Сурет 5- те есімдіктің онтологиялық моделі көрсетілген. 
 
 
 
Сурет 5. Есімдіктің онтологиялық моделі 
 
Сурет  6-  да  етістіктің  онтологиялық  моделі,  сонымен  қатар  сурет  7-  де  қазақ  тіліндегі 
«тара»  етістігінің  оның  жаңа  сөзжасамдарын  жасауға  мүмкіндік  беретін  семантикалық 
гиперграф түрінде бейнеленуі көрсетілген. 
 

205 
 
 
 
Сурет 6. Етістіктің онтологиялық моделі 
 
 
 
Сурет 7. Семантикалық гиперграф түрінде бейнеленуі 
 
Жоғарыда  көрсетілген  етістіктен  етістік  формаларын  [4]  тудыруды  бейнелейтін 
семантикалық  гиперграфты  сызықтық  жақшалық  жазба  арқылы  бейнелейтін  болсақ 
төмендегідей формалды ережелер шығады:  
 
((ет01нг)с)!ое 
(((ет01нг)с)тыр)!өг 
((((ет01нг)с)тыр)ыл)!ые 
((((ет01нг)с)тыр)у)!қа 
((((ет01нг)с)тыр)т)!өг 
(((((ет01нг)с)тыр)т)қыз)!өг 
(((ет01нг)т)қалы)!өк 
(((ет01нг)т)қанша)!өк 
(((ет01нг)т)а)!ок 
(((ет01нг)т)у)!қа 
((ет01нг)л)!ые 
(((ет01нг)л)ды)!өе 
 

206 
 
((((ет01нг)с)тыр)ғыз)!өг 
(((ет01нг)с)ын)!өз 
(((ет01нг)с)па)!бз 
(((ет01нг)с)ты)!өе 
(((ет01нг)с)қан)!өе 
(((ет01нг)с)атын)!өе 
(((ет01нг)с)ар)!ке 
(((ет01нг)с)пақ)!ке 
(((ет01нг)с)ып)!өк 
(((ет01нг)с)қалы)!өк 
(((ет01нг)с)қанша)!өк 
(((ет01нг)с)а)!ок 
((ет01нг)т)!өг 
(((ет01нг)т)ыл)!ые 
((((ет01нг)т)ыл)ма)!бз 
(((ет01нг)т)па)!бз 
((((ет01нг)т)па)у)!қа 
(((ет01нг)т)тыр)!өг 
(((ет01нг)т)қыз)!өг 
((((ет01нг)т)тыр)т)!өг 
((((ет01нг)т)тыр)ғыз)!өг 
((((ет01нг)т)қыз)дыр)!өг 
((((ет01нг)т)қыз)ғыз)!өг 
(((((ет01нг)т)тыр)т)қыз)!өг 
((((((ет01нг)т)тыр)т)қыз)дыр)!өг 
(((((ет01нг)т)қыз)дыр)т)!өг 
 (((ет01нг)т)ты)!өе 
(((ет01нг)т)қан)!өе 
(((ет01нг)т)атын)!өе 
(((ет01нг)т)ар)!ке 
(((ет01нг)т)пақ)!ке 
(((ет01нг)т)ып)!өк 
(((ет01нг)л)ған)!өе 
(((ет01нг)л)атын)!өе 
(((ет01нг)л)ар)!ке 
(((ет01нг)л)мақ)!ке 
(((ет01нг)л)ып)!өк 
(((ет01нг)л)ғалы)!өк 
(((ет01нг)л)ғанша)!өк 
(((ет01нг)л)а)!ок 
(((ет01нг)л)ма)!бз 
((((ет01нг)л)ма)с)!ое 
((ет01нг)н)!өз 
(((ет01нг)н)ды)!өе 
(((ет01нг)н)ған)!өе 
(((ет01нг)н)атын)!өе 
(((ет01нг)н)ар)!ке 
(((ет01нг)н)бақ)!ке 
(((ет01нг)н)ып)!өк 
(((ет01нг)н)ғалы)!өк 
(((ет01нг)н)ғанша)!өк 
(((ет01нг)н)ба)!бз 
(((ет01нг)л)а)!ок 
((ет01нг)ма)!бз 
((ет01нг)у)!қа 
((ет01нг)ды)!өе 
((ет01нг)ған)!өе 
((ет01нг)йтын)!өе 
((ет01нг)р)!ке 
((ет01нг)мақ)!ке 
((ет01нг)п)!өк 
((ет01нг)ғалы)!өк 
((ет01нг)ғанша)!өк 
((ет01нг)й)!ок
 
 
Осы формалды ережелердің көмегімен қазақ тіліндегі етістіктерден етістіктің 75-ке жуық 
жаңа сөзжасамдарын тудыруды автоматтандыруға болады.   

Достарыңызбен бөлісу:
1   ...   19   20   21   22   23   24   25   26   ...   39




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет