Атты І халықаралық конференция ЕҢбектері

жүктеу/скачать 8,57 Mb.

Pdf көрінісі

бет	219/326
Дата	07.01.2022
өлшемі	8,57 Mb.
	#19269

1 ... 215 216 217 218 219 220 221 222 ... 326

Т.И. ИБРАГИМОВ
1
, Ф.И. САЛИМОВ
2

1
Казанский федеральный университет, г.Казань, Россия
2
Казанский федеральный университет,
Институт прикладной семиотики АН РТ, г.Казань, Россия

ЛИНГВИСТИЧЕСКИЕ ПРОБЛЕМЫ СИНТЕЗА ТАТАРСКОЙ РЕЧИ ПО
ОРФОГРАФИЧЕСКОМУ ТЕКСТУ

В  настоящее  время  проблема  синтеза  речи  считается,  в  основном,  решенной.
Существующие  синтезаторы  довольно  качественно  произносят  тексты,  написанные  на
многих европейских языках, в том числе и на русском языке[1-4]. Насколько нам известно,
синтезаторов  речи  для  тюркских  языков,  нашедших  широкое  распространение,  сегодня  не
существует.  В  данной  публикации  мы  остановимся  на  трудностях,  с  котрыми  столкнулись
при разработке синтезатора татарской речи.
Первая  версия  системы  конкатенативного  синтеза  татарской  речи  по  произвольному
орфографическому тексту была создана еще в 2009 году. И хотя качество синтезированной
речи по мнению большинства экспертов было удовлетворительным, по многим причинам эта
разработка осталась на уровне опытного лабораторного образца. В настоящее время в рамках
совместного Татаро-Швейцарского проекта “Ана-теле” завершается разработка новой версии
синтезатора, предназначенного для  работы в системе дистанционного обучения татарскому
языку. Поскольку лингвистическое обеспечение при создании качественных систем синтеза
является определяющим
3
, в данной статье обобщается опыт, приобретенный при разработке
татарского синтезатора.
Синтезатор  татарской  речи  предназначен  для  озвучивания  произвольных  татарских
текстов,  относится  к  числу  конкатенативных.  Процесс  синтеза  речи  в  рамках  этой  модели
можно  представить  как  склеивание  по  правилам  фонетики заранее  озвученных  фрагментов
языка в слова и затем - в предложения.
На  рисунке  ниже  приведена  общая  схема  синтезатора,  в  которой  указывается  какие
действия  при  наличии  каких  ресурсов  и  в  какой  последовательности  должны  выполняться
для преобразования произвольного предложения в звучащую фразу.


3
  Попытки  создания  универсальных  синтезаторов,  покрывающих  одновременно  несколько  различных  языков,
не  увенчались  успехом.  Как  известно,  языки  отличаются  не  только  грамматическими,  но  и  фонетико-
фонологическими  и  ритмико-просодическими  системами.  По  этой  причине  синтезаторы  речи,  разработанные
на  базе  систем  индоевропейских  языков,  оказались  неприменимыми  в  качестве  преобразователей  татарских
текстов в речь.

219

Рис1. Блок-схема функционирования синтезатора татарской речи

1.  Нормализация  включает  предварительную  обработку  входного  текста:  расшифровку
аббревиатур,  перевод  чисел  в  числительные,  удаление  или  расшифровку  различного  рода
символов  (%,  №,  $)  и  пр.  Нормализация  производится  по  определенным  правилам  с
помощью  заранее  подготовленных  словарей.  Выяснилось,  что  многие  аббревиатуры  в
письменном  татарском  языке  употребляются  в  русской  версии  (НИИ,  УВД,  США).  При
доминирующем положении в обществе русского языка перевод их на татарский язык может
инициировать  образование  языкового  барьера.  При  создании  словаря  аббревиатур
рассматривались в основном именно такие варианты, при этом расшифровка таких терминов
переводилось  на  татарский  язык.  Определенная  сложность  возникает  при  переводе  числа  в
числительное.  Например,  цифра  10  в  зависимости  от  контекста  может  быть  расшифрована
как  «ун»  или  «унынчы».  Для  расшифровки  таких  фрагментов  необходим  анализ  контекста
ближайшего  окружения  соответствующего  числа.  Кроме  того,  полноценный  синтезатор
должен  уметь  воспроизводить  также  математические  формулы.  Эта  задача  относится  к
одновременной реализации в рамках одной системы синтеза нескольких языков, кроме того
система кодирования формул математического языка может быть различной, что выводит за
рамки простого перевода формул в текстовое представление. По этой причине такая задача
является достаточно сложной и в данной версии не рассматривалась.
2.  Большие  трудности  в  создании  системы  синтеза  речи  по  орфографическому  тексту
возникают  при  фонемной  транскрипции  входной  фразы.  Под  фонемной  транскрипцией
понимается перевод единиц орфографического текста в звуковые единицы языка. Сложность
преобразования  «графема–фонема»  для  разных  языков  различна.  Что  касается  татарского
языка,  то  трудности  обусловлены,  прежде  всего,  ненаучным  характером  его  орфографии.
Помимо множества незначительных двусмысленностей в правилах типа «… некатегоричное
будущее время глаголов образуется суффиксом -ыр/ер, а в некоторых  случаях суффиксом –
ар/әр (ит+әр)», в орфографии значится такое правило: «слова, заимствованные письменным
путем из русского языка или через него, пишутся так, как принято в русской орфографии»
[6]. Использование данного ïðàâèëà ïðèâåëî к тому, что в ñëîâàðÿõ òàòàðñêîãî языка около 10-
15%  слов  ñîõðàíÿþò  ÷åðòû  àðàáñêîãî  письма,  а  35-  40%  слов  пишутся  ïî-ðóññêè.  Ðàñõîæäåíèÿ

220

ìåæäó  ãðàôèêîé  и  звуковой  системой  ÿçûêà  îêàçàëиñü  çíà÷èòåëüíûì  è  òðóäíî  ïîääàþùèìñÿ
ñèñòåìàòèçàöèè. В связи с таким положением дел при создании транскрибиратора пришлось
выбирать между следующими альтернативами:


íàó÷èòü  ñèíòåçàòîð  произносить  àðàáñêèå  ñëîâà  ñ  àðàáñêèì  àêöåíòîì,  ðóññêèå  ñëîâà  ïî-
ðóññêè, à òàòàðñêèå – ïî-òàòàðñêè


îçâó÷èâàòü çàèìñòâîâàíèÿ в соответствии с ôîíåòè÷åñêîé системой òàòàðñêîãî ÿçûêà.
Современная  орфография  придерживается  первого  варианта.  Для  того,  чтобы  ïðîèçíîñèòü
ðóññêèå  заимствования  на  языке  îðèãèíàëà,  фонетическая  система  òàòàðñêîãî  языка  была
дополнена  гласными  фонемами  /ō/,  /û/,  /ē/,  согласными  -  /ö/,  /ù/,  /q/,  /g/,  /в/,  а  òàêæå
специальными  символами  "ь"  и  "ъ".  В  результате  современная  графика  татарского  языка
представляет  эклектику  трех  языковых  систем  -  собственно  татарской,  а  также  русской  и
арабской.  Но  это  еще  не  все.  Дополнение  фонетической  системы  татарского  языка  тремя
гласными  и  пятью  согласными  оказалось  недостаточным  для  произношения  всех
заимствований  так,  как  в  оригинале.  Потребуется,  по  крайней  мере,  дополнительное
включение  в  фонетическую  систему  татарского  языка  фонем  /а/  и  /ль/,  а  в  оптимальном
случае - всех русских гласных и согласных. Так, в словах [кабинетка] и [гаражга] фонемы
/а/ в начальном и конечным слогах оказались невзаимозаменяемыми, а слова [тол], [толь] и
[тŏл]  контрастируют  не  только  по  гласным  фонемам.  Данное  обстоятельство  вынудило
разработчиков  отказаться  от  предложенных  лингвистами  орфоэпических  норм  и  выбрать
второй  путь  -    озвучивать  заимствования  в  согласии  с  фонетической  системой  òàòàðñêîãî
языка.
Данный подход предполагает осуществление фонематической транскрипции в два этапа.
На первом этапе необходимо определить  - является ли входное слово заимствованным или
исконно  татарским,  на  втором  –  с  помощью  соответствующего  алгоритма  выполнить  саму
транскрипцию.  Такой  способ  (выполнение  транскрипции  в  два  этапа)  вполне  естественен.
Действительно,  чтобы  правильно  транскрибировать,  к  примеру,  слова  Казан  и  Казань,

жүктеу/скачать 8,57 Mb.

Достарыңызбен бөлісу:

1 ... 215 216 217 218 219 220 221 222 ... 326