169
Для интеграции грамматических свойств в лексический тэгсет, был разработан
позиционный тэгсет, согласно которому, лексическая метка состоит из основного тэга
(развернутая часть речи) и закодированной строки грамматических свойств.
Таблица 2 содержит список грамматических свойств учтенных при создании лексического
тэгсета, где под кардинальностью понимается количество возможных значений
принимаемых данным свойством (например: одушевленность имеет два значения).
Таблица 2.
Грамматические свойства, рассматриваемые в
лексическом тэгсете
№
Грамматические свойства
Код
Кардинальность
1
Одушевленность
A
2
2
Число
N
2
3
Принадлежность
S
10
4
Лицо
P
8
5
Падеж
C
7
6
Отрицание
G
2
7
Время
T
3
8
Наклонение
M
4
9
Залог
V
5
Наконец, Таблица 3 содержит полный лексический тэгсет, состоящий из 36 базовых тэгов
(исключая пунктуацию), сгруппированных по частям речи. Каждому тэгу соответствует
цепочка грамматических свойств (ГС), а также генеративная емкость (Емк.), т.е. количество
тэгов получаемое от всех возможных комбинаций ГС и базового тэга. Таким образом,
полный тэгсет состоит из 3844 различных тэгов.
Достарыңызбен бөлісу: