Для составления матриц серединных дифонов сначала был автоматически сгенерирован
список всевозможных сочетаний звуков казахского языка. Затем были удалены из списка
сочетания, противоречащие следующим казахским позиционным правилам:
- звуки а, ә, о, ө, ұ, ү сочетаются со всеми согласными; - звуки е, ы, і не сочетаются с согласным у (w). -
в казахском языке не встречаются подряд идущих 2 гласных;
-
глухие и звонкие согласные не сочетаются;
-
согласный у не встречается после согласных звуков;
Некоторые сочетания были удалены в связи с тем, что они по статистике не встречаются
вообще [10].
В итоге мы получили около 500 звукосочетаний казахского языка.
Но для качественного распознавания их не достаточно, так как казахский язык является
сингармоническим языком.
Рассмотрим дифоны из тех звукосочетаний, в которых один из звуков гласный (таблицы 3,
4). Их количество остается без изменений, так как гласные определяют
огубленность/неогубленность и мягкость/твердость согласного.
Таблица 2. Дифоны с гласно-согласным звукосочетанием