Атты І халықаралық конференция ЕҢбектері


  Аннотированный под-корпус



Pdf көрінісі
бет177/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   173   174   175   176   177   178   179   180   ...   326

Аннотированный под-корпус 
3.1 Разработка тэгсетов 
Руководствуясь  мировым  опытом  по  созданию  тэгсетов,  и  учитывая  специфику 
Казахского  языка,  мы  разработали  синтаксический  (члены  предложения)  и  лексический 
(часть речи) тэгсеты.  
Синтаксический тэгсет описан в таблице 1, содержащей наименование и описание тэгов, 
а также эквиваленты из широко употребляемого тэгсета, Penn tagset.  
 
Таблица 1. Синтаксический тэгсет 
№ 
Тэг 
Описание 
Эквиваленты Penn tagset 


Простое предложение 


BSS 
Главное предложение 


BGS 
Зависимое предложение 
SBAR, SBARQ 

BAS 
Подлежащее 
NP 

BND 
Сказуемое 
VP 

TOL 
Дополнение 
NP, WHNP 

ANT 
Определение 
ADJP 

PYS 
Обстоятельство 
PP, WHP, ADVP, WHADVP 


Пустой/неоднозначный член 

 
Синтаксическим  тэгсетом  также  предусмотрена  разметка  фразеологизмов,  путем 
присвоения тэгу соответствующего бинарного атрибута. 


Достарыңызбен бөлісу:
1   ...   173   174   175   176   177   178   179   180   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет