224
3.
Выявлено, что помимо представительства указанных классов фонологических
структур, элементная база синтезатора включает репрезентанты фонемосочетаний,
встречающихся на стыках слов, в конечной позиции предложений, а также слова длиной в
одну и две фонемы. (ә, ат, ит, өч, ки и т.д.).
4.
Создание дифоной базы на основе выделенных фонемосочетаний производилось по
следующей схеме:
а) В составе псевдофраз нужное фонемосочетание было озвучено диктором и оцифровано.
Псевдофраза состояла из трех ритмических групп, одна из которых представляла 3–х или 4–х
сложное квазислово (слово, лишенное смысла, но имеющее характерное для татарского
языка звучание)
б) Программным путем устанавливались границы входящих в дифон фонем, а затем
границы дифона.
в) Аудированием в различных контекстах проводилась оценка качества звучания дифона.
г) Выполнялась разметка периодов основного тона содержащихся в базе дифонов.
д) Производилась конвертация дифона в базу данных синтезатора.
На настоящее время элементная база синтезатора содержит 2370 дифонов. Увеличение
элементной базы, замена отдельных дифонов более качественными по мере необходимости
будут продолжаться.
Алгоритмы озвучивания построены на известной технологии TD-PSOLA. Этот подход
позволяет производить модификацию просодических характеристик базовых элементов,
размеченных по периодам основного тона.
Достарыңызбен бөлісу: