230
Рисунок 4. Зависимость качества распознавания от количества итераций на обучающем
корпусе.
Рисунок 5. Зависимость качества распознавания от количества итераций на тестовом
корпусе.
Анализ полученных результатов показывает, что рост числа распределений в Гауссовских
смесях и увеличение числа циклов обучения моделей с определенного момента не оказывает
существенного влияния на качество распознавания фонем на тестовом корпусе. Это связано
с тем, что для качественного обучения большего числа распределений необходим всё
больший объем исходной обучающей информации.
Таким образом, при построении системы фонетического распознавателя было решено
выбрать модели фонем, полученные на 40 итерации. В этих моделях число распределений в
Гауссовских смесях равняется 29.
Созданный программный модуль предоставляет возможности записи речевого фрагмента
с помощью микрофона, а также загрузки необходимого звукового файла. Общий вид формы
представлен на Рис. 6.
Рисунок 6. Форма распознавания фонем татарского языка.
Достарыңызбен бөлісу: