Атты І халықаралық конференция ЕҢбектері



Pdf көрінісі
бет183/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   179   180   181   182   183   184   185   186   ...   326
5.4. Разметка и транскрипция 
Каждый аудио файл сопровождается соответствующей орфографической транскрипцией и 
сегментацией  на  уровне  слов  аналогичной  базе  TIMIT,  а  также  морфо-синтактической 
разметкой.  Все  разметка  осуществлялась  вручную  обученными  лингвистами.  К  примеру, 
орфографическая транскрипция содержит развернутые значения сокращений, чисел и дат, в 
соответствие  с  тем,  как  их  прочитали  дикторы.  Дополнительно,  каждое  предложение 
начинается  со  специальных  символов  начала  и  конца  предлдожения.  Для  сегментации  мы 
использовали  программное  обеспечение  WaveSurfer  (2013),  которое  поддерживает 
аннотацию TIMIT. 
 


Достарыңызбен бөлісу:
1   ...   179   180   181   182   183   184   185   186   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет