Задача нормализации слов казахского языка д. Р. Рахимова a,b, А. О. Турганбаева a


Классификация суффиксов казахского языка



Pdf көрінісі
бет5/10
Дата24.05.2023
өлшемі427,3 Kb.
#96884
түріЗадача
1   2   3   4   5   6   7   8   9   10
Классификация суффиксов казахского языка
В казахском языке существуют два вида суффиксов: 
1) словообразующие (TdJr); 
2) формообразующие (TrJr).
Словообразующие суффиксы служат для образо-
вания новых слов (меняется смысл слова). Например: 
əн — песня, əн-ші — певец; ақыл — ум, ақыл-ды — 
умный.
Формообразующие суффиксы служат для образова-
ния форм слова. Например: жеті — семь, жеті-нші — 
седьмой; қатты — твердый, қатты-рақ — тверже; 
оқы — читай, оқы-лды — прочитано.
В свою очередь, формообразующие суффиксы под-
разделяются на модифицированные и грамматические 
суффиксы.
К модифицированным суффиксам относятся: про-
изводные суффиксы существительного; суффиксы 
степени сравнения имен прилагательных; суффиксы 
порядковых имен числительных; суффиксы глаголов, 
формирующих залог, усилительный и отрицательный 
виды глагола.
Суффиксы отрицательного глагола и производные 
суффиксы существительного не будут добавлены в базу 
аффиксов. Например, в слове бармаңыздар (бар + ма 
(суф.отр.гл) + ңыз (JJ) + дар (KJ), но будет правильно 
вывести на результат основу барма, вместо словы бар.
Грамматические суффиксы, которые являются по-
казателями преобразования глагола табл. 1: суффиксы 
деепричастия; суффиксы причастия; суффиксы накло-
нения; суффиксы времени.
Общее количество всевозможных суффиксов со-
ставляет 26 526 единиц. Некоторые типы, приведенные 
в табл. 2, являются лексически и семантически допу-
Таблица 1. Индексация суффиксов
Символ
Значение
Суффиксы
Ks
Суффиксы деепричастия
-а, -е, -й, -ып, -іп, -п 
q (1)
-ғалы, -гелі, -қалы, -келі 
q (2)
E
Суффиксы причастия
-ған, -ген, -қан, -кен, -атын, -етін, -йтын, -йтін 
q (1)
-ар, -ер, -р, -с, -мақ, -мек, -бақ, -бек, -пақ, -пек 
q (2)
R
Суффиксы наклонения
Условное наклонение: -са, -се 
q (1)
Желательное наклонение: -ғы, -гі, -қы, -кі 
q (2)
Повелительное наклонение: -айын, -ейін, -йын, -йін, 
-іңіз, -ыңыз, -ңіз, -ңыз, -сін, -сын, 
-ейік, -айық, -йік, -йық, 
-іңдер, -ыңдар, -ңдар, -ңдер, 
-іңіздер, -ыңыздар, -ңіздер, -ңыздар 
q (3)
Изъявительное наклонение: суффиксы времен
Sh
Суффиксы времени
Прошедшее время: -ып, -іп, -п 
q (1)
-ған, -ген, -қан, -кен, -атын, -етін, -йтын, -йтін 
q (2) 
-ды, -ді, -ты, -ті 
q (3)
Настоящее время: 
-ып, -іп, -п + тұр, жүр, отыр, жатыр 
q (4)
-а, -е, -й 
q (5)
Будущее время: -а, -е, -й 
q (5)
-ып, -іп, -п + тұр, жүр, отыр, жатыр 
q (6)
-ар, -ер, -р, -бақ, -бек, -пақ, -пек, -мақ, -мек
Д.Р. Рахимова, А.О. Турганбаева


Научно-технический вестник информационных технологий, механики и оптики,
548 
2020, том 20, № 4
ЗАДАЧА НОРМАЛИЗАЦИИ СЛОВ КАЗАХСКОГО ЯЗЫКА 
стимыми, но некоторые из них не применяются. В базу 
аффиксов добавлены только те, которые наиболее часто 
применяются.
Далее представлено, в каком порядке к основе до-
бавляются аффиксы, для выделения правильной осно-
вы, но не были рассмотрены словообразующие суф-
фиксы, так как они меняют основу слова и контекст 
значения. В основном к существительным добавляются 
словообразующие суффиксы.
W = {N
i
} + {E
i
},
W = {A
i
} + {S1
i
},
W = {R
i
} + {S2
i
},
W = {V
i
} + {S3
i
} + {S4
i
} + {E
i
},
S3 = {EtKp},
S4 = {Ks1, Ks2, Sh3, Sh4, E1, R2, R1, R2, R3},
где N — множество основ имен существительных и 
местоимений; V — множество глагольных основ; A — 
множество имен прилагательных; R — множество имен 
числительных; W — множество слов; S — множество 
формообразующих суффиксов, S1, S2, S3, S4; Et — 
суффиксы залога; Kp — усилительный вид суффиксов; 
Ks — cуффиксы деепричастия; E — множество окон-
чаний.
На основе выполненных исследований и разрабо-
танной системы классификации окончаний казахско-
го языка были построены детерминированные конеч-
ные автоматы (ДКА) для различных частей речи. 
На рис. 1 представлен ДКА для окончаний имен су-
ществительных казахского языка, на котором показаны 
возможные вариации «q
0
»–«q
7
» словообразования для 
данной части речи в казахском языке. Каждый граф 
описывает преобразования слова с помощью присо-
единения окончаний к основе и порядок присоедине-
ния, который синтаксически и семантически допустим 
в казахском языке. 
Рис. 1 иллюстрирует ДКА с помощью диаграммы 
состояний. Для каждого состояния существует стрелка 
перехода, обозначающая присоединение определенно-
го вида окончания. ДКА имеет начальное состояние 
(графически показывается стрелкой «из ниоткуда»), 
откуда начинается вычисление с переходом Snoun 
(основа имени существительных казахского языка), и 
множество (обозначаемых графически в виде двойной 
окружности), которые определяют с помощью образо-
вания различных вариации присоединение окончаний, 
успешно завершающие вычисления.


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   10




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет