5.4. Разметкаи транскрипция Каждый аудио файл сопровождается соответствующей орфографической транскрипцией и
сегментацией на уровне слов аналогичной базе TIMIT, а также морфо-синтактической
разметкой. Все разметка осуществлялась вручную обученными лингвистами. К примеру,
орфографическая транскрипция содержит развернутые значения сокращений, чисел и дат, в
соответствие с тем, как их прочитали дикторы. Дополнительно, каждое предложение
начинается со специальных символов начала и конца предлдожения. Для сегментации мы
использовали программное обеспечение WaveSurfer (2013), которое поддерживает
аннотацию TIMIT.