Атты І халықаралық конференция ЕҢбектері



Pdf көрінісі
бет178/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   174   175   176   177   178   179   180   181   ...   326
Лексический тэгсет. Казахский язык относится к агглютинативным Тюркским языкам, в 
которых словоформы образуются путем присоединения к корню цепочки морфем. Морфемы 
характеризуют  различные  грамматические  свойства  (лицо,  падеж,  и  т.д.)  и  несут  в  себе 
важную контекстную информацию, без  учета  которой лексический разбор может оказаться 
не полным. 
Сравним варианты лексического разбора одного и того же предложения на трех языках: 
 
Мектепке/существительное бардым/глагол ./. 
I/местоимение went/глагол to/предлог school/существительное ./. 
Я/местоимение пошла/глагол в/предлог школу/существительное ./. 
 
Как видим, в Казахском варианте отсутствуют местоимение и предлог, которые переданы 
морфемами в лице глагола и падеже существительного соответственно: 
 
Мектеп/сущ. + ке/(вин. падеж = предлог «В»)  
бар/глагол + ды/(прошед. время) + м/(I лицо = мест. «Я») ./. 


169 
 
 
Для  интеграции  грамматических  свойств  в  лексический  тэгсет,  был  разработан 
позиционный  тэгсет,  согласно  которому,  лексическая  метка  состоит  из  основного  тэга 
(развернутая часть речи) и закодированной строки грамматических свойств. 
 
Таблица 2 содержит список грамматических свойств учтенных при создании лексического 
тэгсета,  где  под  кардинальностью  понимается  количество  возможных  значений 
принимаемых данным свойством (например: одушевленность имеет два значения). 
 
Таблица 2. Грамматические свойства, рассматриваемые в лексическом тэгсете
 
№ 
Грамматические свойства 
Код 
Кардинальность 

Одушевленность 



Число 



Принадлежность 

10 

Лицо 



Падеж 



Отрицание 



Время 



Наклонение 



Залог 


 
Наконец, Таблица 3 содержит полный лексический тэгсет, состоящий из 36 базовых тэгов 
(исключая  пунктуацию),  сгруппированных  по  частям  речи.  Каждому  тэгу  соответствует 
цепочка грамматических свойств (ГС), а также генеративная емкость (Емк.), т.е. количество 
тэгов  получаемое  от  всех  возможных  комбинаций  ГС  и  базового  тэга.  Таким  образом, 
полный тэгсет состоит из 3844 различных тэгов. 
 


Достарыңызбен бөлісу:
1   ...   174   175   176   177   178   179   180   181   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет