Атты І халықаралық конференция ЕҢбектері



Pdf көрінісі
бет226/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   222   223   224   225   226   227   228   229   ...   326
Звуковой корпус 
В качестве исходного материала при создании моделей фонем языка используется корпус 
звучащей  речи.  При  этом  необходимо  наличие  аннотации  корпуса,  включающей  в  себя 
текстовую  и/или  фонетическую  разметку  всех  речевых  фрагментов.  Однако  ручное 
фонетическое  аннотирование  является  очень  дорогостоящим  и  длительным  процессом,  а 
также  требует  наличие  множества  квалифицированных  фонетистов,  что  делает 
затруднительным  создание  данного  типа  разметки  для  корпуса  татарского  речи. 
Альтернативным  решением  служит  подход  под  название  phoneme  alignment,  который 
позволяет в параллельном режиме осуществлять как фонетическую разметку корпуса, так и 
обучение моделей фонем. Данный подход был использован в работе, а для его применения 
была создана текстовая аннотация записанных голосовых файлов. 
Первым  этапом  создания  корпуса  звучащей  речи  является  формирование  текста  для 
озвучивания. При создании фонетического анализатора в качестве искомой характеристики 
текста  оправдан  выбор  показателя  частотности  употребления  входящих  в  него  слов.  Для 
этого были проанализированы 5061 текст татарской литературы и публицистики. Основные 
характеристики использованных произведений представлены в Таблице 1. 
 
Таблица 1. Характеристика исходных текстов на татарском языке. 
Параметр 
Значение 
Количество текстов 
5061 
Общий объем текстов 
337 МБ 
Общее количество слов 
25 584 505 
Количество различных слов 
1 418 909 
На  основе  данных  текстов  была  построена  статистика  частотности  слов.  Первые  10788 
самых часто употребимых слова были выбраны для озвучивания в речевом корпусе. Запись 
звуковых фрагментов осуществлялась со следующими параметрами: 

 
формат файла: WAV PCM; 

 
частота дискретизации: 22 kHz; 

 
количество бит на отсчет: 16 бит. 
Созданный корпус имеет параметры, представленные в Таблице 2. 
 


227 
 
Таблица 2. Основные характеристики звукового корпуса. 
Параметр 
Значение 
Общее количество файлов 
10788 
Общая продолжительность записей 
4:56:45 
Количество файлов в обучающем корпусе 
9631 
Продолжительность обучающем корпусе 
4:26:42 
Количество файлов в тестовом корпусе 
1157 
Продолжительность тестовом корпусе 
0:30:03 


Достарыңызбен бөлісу:
1   ...   222   223   224   225   226   227   228   229   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет