Атты І халықаралық конференция ЕҢбектері



Pdf көрінісі
бет205/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   201   202   203   204   205   206   207   208   ...   326
Байланысты:
Болатбек М. (1)

Процедурный  метод  предполагает  предварительную  систематизацию  морфологических 
знаний  о  естественном  языке  и  разработку  алгоритмов  присвоения  морфологической 
информации  отдельной  словоформе[3,4].  Процедурный  морфологический  анализатор  
состоит из следующих этапов: выделение в текущей словоформе основы, ее идентификация, 
приписывание  словоформе  соответствующего  перечня  морфологической  информации.  К 
недостаткам  этого  метода  относятся  высокая  трудоемкость  составления  словарей 
совместимости,  что  является  трудно  решаемой  и  не  автоматизируемой  полностью  задачей 
для  языков,  которым  свойственно  большое  число  слов-исключений.  Реализация  данного 
способа  занимает  значительно  меньший  объем  памяти,  но  при  этом  увеличивается  время 
морфологического  анализа  за  счет  разбиения  словоформы  на  составляющие  и  применения 
процедур совместимости [4].  
При  использовании    процедурного  метода  алгоритм  морфологического  анализа 
значительно  усложняется.  Дело  в  том,  что,  например,  для  существительных  личное 
окончание первого лица «-м» входит в другие окончания «-мін»,  «-міз» и другие.    
Рассмотрим пример для слова «бала - ребенок» (лемма) и двух его словоформ «баламның 
-  моего  ребенка»,    «баламын  -  я  ребенок».  В  первом  случае  к  основе  присоединены  два 
окончания  личное  окончание  первого  лица  «-м»  и  падежное  окончание  «-ның».  Во  втором 
случае к основе добавлено одно личное окончание первого лица  «-мын».  Алгоритм поиска 
должен  предусматривать  любое  возможное  количество  присоединенных  окончаний    и 
накопление  морфологической информации. Ниже будет построен алгоритм поиска слова и 
его морфологической информации[81,82,83]:  
1. Слово считывается;  


200 
 
2. Открывается словарь начальных форм  и в нем выполняется поиск  считанного слова;  
3. Если слово найдено, то перейти к шагу 8, иначе шаг 4 ; 
4.    Слово  в  цикле  посимвольно  считывается,  начиная  с  последнего  символа,  то,  что 
получается, ищем в словаре окончаний; 
5. Если окончание найдено, то остаток ищем в словаре начальных форм; 
6. Запоминаем  морфологическую информацию слова; 
7. Если такое слово не найдено, то переходим к шагу 4, иначе к шагу 8 ;  
8. Конец. 


Достарыңызбен бөлісу:
1   ...   201   202   203   204   205   206   207   208   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет