Классификация суффиксов казахского языка В казахском языке существуют два вида суффиксов:
1) словообразующие (TdJr);
2) формообразующие (TrJr).
Словообразующие суффиксы служат для образо-
вания новых слов (меняется смысл слова). Например:
əн — песня, əн-ші — певец; ақыл — ум, ақыл-ды —
умный.
Формообразующие суффиксы служат для образова-
ния форм слова. Например: жеті — семь, жеті-нші —
седьмой; қатты — твердый, қатты-рақ — тверже;
оқы — читай, оқы-лды — прочитано.
В свою очередь, формообразующие суффиксы под-
разделяются на модифицированные и грамматические
суффиксы.
К модифицированным суффиксам относятся: про-
изводные суффиксы существительного; суффиксы
степени сравнения имен прилагательных; суффиксы
порядковых имен числительных; суффиксы глаголов,
формирующих залог, усилительный и отрицательный
виды глагола.
Суффиксы отрицательного глагола и производные
суффиксы существительного не будут добавлены в базу
аффиксов. Например, в слове бармаңыздар (бар + ма
(суф.отр.гл) + ңыз (JJ) + дар (KJ), но будет правильно
вывести на результат основу барма, вместо словы бар.
Грамматические суффиксы, которые являются по-
казателями преобразования глагола табл. 1: суффиксы
деепричастия; суффиксы причастия; суффиксы накло-
нения; суффиксы времени.
Общее количество всевозможных суффиксов со-
ставляет 26 526 единиц. Некоторые типы, приведенные
в табл. 2, являются лексически и семантически допу-
Таблица 1. Индексация суффиксов
Символ
Значение
Суффиксы
Ks Суффиксы деепричастия
-а, -е, -й, -ып, -іп, -п
q (1)
-ғалы, -гелі, -қалы, -келі
q (2)
E Суффиксы причастия
-ған, -ген, -қан, -кен, -атын, -етін, -йтын, -йтін
q (1)
-ар, -ер, -р, -с, -мақ, -мек, -бақ, -бек, -пақ, -пек
q (2)
R Суффиксы наклонения
Условное наклонение: -са, -се
q (1)
Желательное наклонение: -ғы, -гі, -қы, -кі
q (2)
Повелительное наклонение: -айын, -ейін, -йын, -йін,
-іңіз, -ыңыз, -ңіз, -ңыз, -сін, -сын,
-ейік, -айық, -йік, -йық,
-іңдер, -ыңдар, -ңдар, -ңдер,
-іңіздер, -ыңыздар, -ңіздер, -ңыздар
q (3)
Изъявительное наклонение: суффиксы времен
Sh Суффиксы времени
Прошедшее время: -ып, -іп, -п
q (1)
-ған, -ген, -қан, -кен, -атын, -етін, -йтын, -йтін
q (2)
-ды, -ді, -ты, -ті
q (3)
Настоящее время:
-ып, -іп, -п + тұр, жүр, отыр, жатыр
q (4)
-а, -е, -й
q (5)
Будущее время: -а, -е, -й
q (5)
-ып, -іп, -п + тұр, жүр, отыр, жатыр
q (6)
-ар, -ер, -р, -бақ, -бек, -пақ, -пек, -мақ, -мек
Д.Р. Рахимова, А.О. Турганбаева
Научно-технический вестник информационных технологий, механики и оптики,
548
2020, том 20, № 4
ЗАДАЧА НОРМАЛИЗАЦИИ СЛОВ КАЗАХСКОГО ЯЗЫКА
стимыми, но некоторые из них не применяются. В базу
аффиксов добавлены только те, которые наиболее часто
применяются.
Далее представлено, в каком порядке к основе до-
бавляются аффиксы, для выделения правильной осно-
вы, но не были рассмотрены словообразующие суф-
фиксы, так как они меняют основу слова и контекст
значения. В основном к существительным добавляются
словообразующие суффиксы.
W = {N i } + {E i },
W = {A i } + {S1
i },
W = {R i } + {S2
i },
W = {V i } + {S3
i } + {S4
i } + {E i },
S3 = {Et, Kp},
S4 = {Ks1, Ks2, Sh3, Sh4, E1, R2, R1, R2, R3},
где N — множество основ имен существительных и
местоимений; V — множество глагольных основ; A —
множество имен прилагательных; R — множество имен
числительных; W — множество слов; S — множество
формообразующих суффиксов, S1, S2, S3, S4; Et —
суффиксы залога; Kp — усилительный вид суффиксов;
Ks — cуффиксы деепричастия; E — множество окон-
чаний.
На основе выполненных исследований и разрабо-
танной системы классификации окончаний казахско-
го языка были построены детерминированные конеч-
ные автоматы (ДКА) для различных частей речи.
На рис. 1 представлен ДКА для окончаний имен су-
ществительных казахского языка, на котором показаны
возможные вариации «q 0
»–«q 7
» словообразования для
данной части речи в казахском языке. Каждый граф
описывает преобразования слова с помощью присо-
единения окончаний к основе и порядок присоедине-
ния, который синтаксически и семантически допустим
в казахском языке.
Рис. 1 иллюстрирует ДКА с помощью диаграммы
состояний. Для каждого состояния существует стрелка
перехода, обозначающая присоединение определенно-
го вида окончания. ДКА имеет начальное состояние
(графически показывается стрелкой «из ниоткуда»),
откуда начинается вычисление с переходом Snoun
(основа имени существительных казахского языка), и
множество (обозначаемых графически в виде двойной
окружности), которые определяют с помощью образо-
вания различных вариации присоединение окончаний,
успешно завершающие вычисления.