Атты І халықаралық конференция ЕҢбектері

жүктеу/скачать 8,57 Mb.

Pdf көрінісі

бет	25/39
Дата	25.12.2016
өлшемі	8,57 Mb.
	#403

1 ... 21 22 23 24 25 26 27 28 ... 39

СӨЙЛЕУЛЕРДІ СИНТЕЗДЕУ ЖӘНЕ ТАНУ ЖҮЙЕЛЕРІ СИСТЕМЫ РАСПОЗНАВАНИЯ И СИНТЕЗА РЕЧИ SPEECH RECOGNITION AND SYNTHESIS SYSTEMS
Т.И. ИБРАГИМОВ 1 , Ф.И. САЛИМОВ 2

Әдебиеттер
1.

Норенков  И.П.  Задачи  управления  знаниями,  извлекаемыми  из  текстовых
документов. // Электронное научно-техническое издание «Наука и образование», 2011, 9.
2.

Bevainyte  A.,  Butenas  L.  Document  classification  using  weighted  ontology//  Materials
Physics and Mechanics, 2010, №9

Г.
ШЫНАТАЙ

Л.Н.Гумилев атындағы Еуразия ұлттық университеті, Астана

ҚАЗАҚ ТІЛІНДЕГІ СӨЗ ТІРКЕСТЕРДІ ӨҢДЕУ

Қазақ  тіліндегі  мәтінді,сөйлемді,  сөз  тіркестерін  математикалық  лингвистика  әдісімен
зерттеу  және  сөйлемдерді  талдау  мен  құруды  автоматтандыру  проблемасы  қазіргі  кезде
лингвистика  және  информатика    саласында  өте  өзекті  болып  табылады.Соның  ішінде
сөйлемдерді  семантикалық  талдау  мәселесі  компьютерлік  лингвистика  бағытында
маңызды.Өйткені  бұл мәселенің шешімі авторлық  құқықты қорғаумен тікелей байланысты,

214

мысалы  антиплагиат.Бұл  мәселені  шешуге  арналған  әдістер  мен  программалар  бар,  алайда
мағынасы  бойынша  қазақ  тіліндегі  мәтіндерді  салыстыратын  жетілдірілген  программа  мен
оның теориялық негіздемесі жоқ.
Қазіргі  таңда  Хэмминг  және  Хопфилд  нейрожелілерін  қолдану  арқылы  лингвистика
саласының көптеген өзекті мәселелерін шешуге болады.Семантикалық талдау барысында сөз
тіркестерін  өңдеу  қарастырылады.  Сөз  тіркесі  сөздердің  бір  бірімен  тіркесуімен  жасалады.
Сөздер зат пен құбылысты, сапа мен белгіні немесе іс-әрекетті атайды. Сөз тіркестерінде зат
пен құбылыс, сапа мен белгі немесе іс-әрекеттер жеке сөздердегідей дара күйінде емес, өзара
бір-бірімен  байланысты  болады.  Сөз  тіркестерінің  синтаксисі  сөздердің  өзара  тіркесу
қабілеттілігі,  тіркесу  тәсілдері  мен  сұлбаларын  (формаларын)  және  сөз  тіркестерінің
құрамы  мен  түрлерін  морфологиямен  тығыз  байланыста  қарастырады.  Онда  сөздерді  сөз
тіркесі  мен  сөйлемнің  бөлшектері  ретінде,  ал  жалғауларды  сөздердің  бір  бірімен
қиюластырып тұратын морфологиялық-синтаксистік категория ретінде зерттейді.
Сөз тіркестері грамматикалық тәсілдер арқылы байланысқан кем дегенде екі толық
мағыналы сөзден құралады. Құрастырушы сыңарлар бірі бағыныңқы, екіншісі басыңқы мүше
ретінде қызмет атқарады. Сыңарлар бір бірімен өзара сабақтасып, белгілі бір мағыналық
және синтаксистік заңдылықтар негізінде байланысады. Сөз тіркесі атау құралы ретінде
негізгі сөз (басыңқы) арқылы затты, құбылысты, үрдісті (процесті), сапаны белгілейді.
Сөздер  жалғаулар  арқылы  байланысуы  мүмкін.  Cөздер  байланысуының  бес  түрі  бар:
қабысу,  матасу,  меңгеру,  қиысу,  жанасу.Стратегияларда  ақырлы  автоматпен  деңгей
бойынша бөлу жүріледі.
Жұмысымызда қазақ тіліндегі сөз тіркестерін өңдеу  үшін ақырлы автоматты қолданудың
сипаттамалары анықталады Осы мақсатты жүзеге асыру үшін келесі міндеттер қойылды:


мәтінді сөз, сөйлем, азат жолдарға бөлу;


ішкі құрылымдарын білместен бұл деңгейлерге біробразды қарау;


бұл деңгейлерді бастапқы күйінде қалтырмау керек, себебі мәтіндердің көп мөлшерде
көшірілімі жасалынады;
Деңгейлер  индекстермен  белгіленген  тізім
болып  сақталынады.Логикалық  түрде  мұнда
диапазондар
концепциясы
кірістіріледі
(Range,
[1]
,
[2]
,
[3]
);  Диапазондарда  бастапқы
және
ақырғы
индекстері
бар:
RangeItem(BeginIndex,
EndIndex),
немесе
бастапқы
индекс
және
жылжу
саны:
Range(BeginIndex,  Count).  Индекстер  мәтіндегі
символдардың  позициясымен  нақты  сәйкес
келеді.  Егер  толық  мәтінді  белгілейтін  болсақ,
онда
келесі
түрде
болады
RangeItem(1,
Length(Text)).Ал  егер  бізге  мәтін  ортасындагы  азат  жол  керек  болса  RangeItem(312031,
312355)  белгіленуі  қолданылады.  Cөз  тіркестерінде    қолданылуы  мысалы:  есімді  (1.1),
етістікті  (1.2),    меңгеру  (2.1.1),  қабысу(2.1.2),  матасу(2.1.3),қиысу  (2.1.4),меңгеру  (2.2.1),
қабысу(2.2.2),  қиысу(2.2.2)  .Қабыса  байланысқан  есімді  сөз  тіркестері    зат  есім  мен  зат
есімнің тіркесі түрінде (3.1.2.1.1,3.1.2.2.1), сын есім мен зат есімнің тіркесі түрінде (3.1.2.1.2,
3.1.2.2.2.1),есімше  мен  зат  есім  тіркесі  түрінде  (3.1.2.1.4,  3.1.2.2.4.1).Тізімдер  диапазоны
мәтіннің тура көшірілімі жасалынбаған мәтін бөлімдері болып көрсетіледі.
1
Сөз тіркестері
1.1
Есімді
1.2
Етістікті
2.1.1
Меңгеру
2.1.2
Қабысу
2.1.3
Матасу

215

2.1.4
Қиысу
2.2.1
Меңгеру
2.2.2
Қабысу
2.2.3
Қиысу
2.2.4
Жанасу
3.1.2.1.1
Зат есім
3.1.2.2.1.1 Зат есім
3.1.2.1.2
Сын есім
3.1.2.2.2.1 Зат есім
3.1.2.2.2.3 Сан есім
3.1.2.2.2.4 Есімдік
3.1.2.1.3
Сан есім
3.1.2.2.3.1 Зат есім
3.1.2.2.3.2 Сын есім
3.1.2.2.3.4 Есімдік
3.1.2.1.4
Есімше
3.1.2.2.4.1 Зат есім
3.1.2.2.4.2 Сын есім
3.1.2.2.4.3 Сан есім
3.1.2.2.4.4 Есімдік
3.1.2.1.5
Үстеу
3.1.2.2.5.1   Зат есім
3.1.2.2.5.2 Сын есім
3.1.2.2.5.3 Сан есім
3.1.2.2.5.4 Есімдік


Қиысуда бағыныңқы сөз басыңқы сөздің грамматикалық мағынасына, тұлғасына
бейімделе

тиісті жалғауда айтылып байланысады.
1.

Бағыныңқы сөз – есімді, орын тартібі арқылы, қабысу, сын есім + зат есім.
2.

Басыңқы сөздің –есімді, орын тартібі арқылы, қабысу, сын есім + зат есім+ілік
септік жалғауы.
3.

Грамматикалық мағынасына –  есімді, қабысу, сын есім+ зат есім.
4.

Грамматикалық тұлғасына –  есімді, қабысу, сын есім+ зат есім.
5.

Мағынасына бейімделе – етістікті, меңгеру, жалғау арқылы, зат есім + барыс септік
жалғауы + етістік.
6.

Тұлғасына бейімделе – етістікті, меңгеру, жалғау арқылы, зат есім + барыс септік
жалғауы + етістік.
7.

Сөздің мағынасына – есімді, жалғау арқылы, матасу, зат есім + ілік септік + зат
есім
8.

Сөздің тұлғасына  – есімді, жалғау арқылы, матасу, зат есім + ілік септік + зат есім
9.

Тиісті жалғауда -  есімді, қабысу, сын есім + зат есім.
10.

Бейімделе байланысады -  етістікті, жанасу, үстеу + етістік.
11.

Қиысуда байланысады – етістікті, жалғау арқылы, меңгеру, зат есім+ етістік.
12.

Сөз байланысады – етістікті, қиысу, зат есім + етістік+ тәуелдік жалғауының  III-
жағы, жекеше
есімді ,қабысу
есімді ,қабысу

есімді ,қабысу

есімді ,қабысу

етістікті,меңгеру
есімді,матасу
Есімді,қабысу
етістікті,жанасу
Етістікті,меңгеру
етістікті,жанасу
етістікті,қиысу

216

Жұмыс барысында диапазондардан абстракцияны алға қою мәселесі шығып отыр. Жалпы
мәтіннің  бірінші  және  соңғы  жолдарын  көрсететін  диапазондар  тізіміне  қарағанда,  біз  тек
соның  негізіндегі  мәтінді  көре  алуымыз  керек.  Сөздерді  анықтау  басты  мәселе  емес.
Сөйлемдерді  анықтау  кезінде  кейбір  қиындықтармен  кездесеміз.  Мысалы  сөйлемнің  соңын
анықтайтын  легальді  белгілердің,яғни  нүкте,  сұрақ,  леп  белгілер  мәселесі.Міне  осындай
легальді  белгілердің  қайталанып,қатар  келуі  немесе  бір  сөйлемнің  ішінде  бірнеше  рет
кездесуі сөйлемдер санының өз санынан артық болып кетуіне әкеледі. Бұл мәселені шешудің
бірден бір жол – ақырлы автомат. Ақырлы автоматтың қолданылуының бірегей себебі,келіп
түскен      символдар  тізімінің  құрылымын  анықтайды:  сөз,  тыныс  белгілер,  функциялар,
құрылымдар,  әдісі  және  өрісі  бар  толық  кластар.  Осындай  тәртіппен  код  анализаторлары,
компиляторлар,  компьютерлер  жұмыс  істейді.Қорытындылай  келсек,  алынған  ғылыми
нәтижелердің  ғылыми-практикалық  құндылығы  қазақ  тілінің  теориясын  жетілдіруге  және
оның  қолданыс  аясын  кеңейтуге  ықпал  жасайтындығы.  Жұмыс  нәтижесі    қазақ  тілінде
мәтіндік процессорлар, ақпараттық технологиялар мен жүйелер және басқа да программалық
дестелер жасауда өз үлесін қосары сөзсіз.

Әдебиеттер
1. «Мәтіндік анализатор» жобасының негіздемелері (Borland C++ Builder 6.0)
2. Ақырлы автоматтарған арналған мәтінді деңгейлерге бөлетін өтілім кестелері
3. Серғалиев М.С. Сөйлем және сөз тіркесі. Материлы учебно-теор. конф.Уақыт
ұштастырған желі: көшпелілер әлемі ХХ ғасырдағы тарих ғылымында. -Астана, 2004, -Б.20-
25
4. Балақаев М. Б. Қазіргі қазақ тілі: Сөз тіркесі мен жай сөйлем синтаксисі. – Астана:
Л.Н.Гумилев атындағы ЕҰУ, 2006. -237б.

217

СӨЙЛЕУЛЕРДІ СИНТЕЗДЕУ ЖӘНЕ ТАНУ ЖҮЙЕЛЕРІ
СИСТЕМЫ РАСПОЗНАВАНИЯ И СИНТЕЗА РЕЧИ
SPEECH RECOGNITION AND SYNTHESIS SYSTEMS

218

Т.И. ИБРАГИМОВ
1
, Ф.И. САЛИМОВ
2

1
Казанский федеральный университет, г.Казань, Россия
2
Казанский федеральный университет,
Институт прикладной семиотики АН РТ, г.Казань, Россия

ЛИНГВИСТИЧЕСКИЕ ПРОБЛЕМЫ СИНТЕЗА ТАТАРСКОЙ РЕЧИ ПО
ОРФОГРАФИЧЕСКОМУ ТЕКСТУ

В  настоящее  время  проблема  синтеза  речи  считается,  в  основном,  решенной.
Существующие  синтезаторы  довольно  качественно  произносят  тексты,  написанные  на
многих европейских языках, в том числе и на русском языке[1-4]. Насколько нам известно,
синтезаторов  речи  для  тюркских  языков,  нашедших  широкое  распространение,  сегодня  не
существует.  В  данной  публикации  мы  остановимся  на  трудностях,  с  котрыми  столкнулись
при разработке синтезатора татарской речи.
Первая  версия  системы  конкатенативного  синтеза  татарской  речи  по  произвольному
орфографическому тексту была создана еще в 2009 году. И хотя качество синтезированной
речи по мнению большинства экспертов было удовлетворительным, по многим причинам эта
разработка осталась на уровне опытного лабораторного образца. В настоящее время в рамках
совместного Татаро-Швейцарского проекта “Ана-теле” завершается разработка новой версии
синтезатора, предназначенного для  работы в системе дистанционного обучения татарскому
языку. Поскольку лингвистическое обеспечение при создании качественных систем синтеза
является определяющим
3
, в данной статье обобщается опыт, приобретенный при разработке
татарского синтезатора.
Синтезатор  татарской  речи  предназначен  для  озвучивания  произвольных  татарских
текстов,  относится  к  числу  конкатенативных.  Процесс  синтеза  речи  в  рамках  этой  модели
можно  представить  как  склеивание  по  правилам  фонетики заранее  озвученных  фрагментов
языка в слова и затем - в предложения.
На  рисунке  ниже  приведена  общая  схема  синтезатора,  в  которой  указывается  какие
действия  при  наличии  каких  ресурсов  и  в  какой  последовательности  должны  выполняться
для преобразования произвольного предложения в звучащую фразу.


3
  Попытки  создания  универсальных  синтезаторов,  покрывающих  одновременно  несколько  различных  языков,
не  увенчались  успехом.  Как  известно,  языки  отличаются  не  только  грамматическими,  но  и  фонетико-
фонологическими  и  ритмико-просодическими  системами.  По  этой  причине  синтезаторы  речи,  разработанные
на  базе  систем  индоевропейских  языков,  оказались  неприменимыми  в  качестве  преобразователей  татарских
текстов в речь.

219

Рис1. Блок-схема функционирования синтезатора татарской речи

1.  Нормализация  включает  предварительную  обработку  входного  текста:  расшифровку
аббревиатур,  перевод  чисел  в  числительные,  удаление  или  расшифровку  различного  рода
символов  (%,  №,  $)  и  пр.  Нормализация  производится  по  определенным  правилам  с
помощью  заранее  подготовленных  словарей.  Выяснилось,  что  многие  аббревиатуры  в
письменном  татарском  языке  употребляются  в  русской  версии  (НИИ,  УВД,  США).  При
доминирующем положении в обществе русского языка перевод их на татарский язык может
инициировать  образование  языкового  барьера.  При  создании  словаря  аббревиатур
рассматривались в основном именно такие варианты, при этом расшифровка таких терминов
переводилось  на  татарский  язык.  Определенная  сложность  возникает  при  переводе  числа  в
числительное.  Например,  цифра  10  в  зависимости  от  контекста  может  быть  расшифрована
как  «ун»  или  «унынчы».  Для  расшифровки  таких  фрагментов  необходим  анализ  контекста
ближайшего  окружения  соответствующего  числа.  Кроме  того,  полноценный  синтезатор
должен  уметь  воспроизводить  также  математические  формулы.  Эта  задача  относится  к
одновременной реализации в рамках одной системы синтеза нескольких языков, кроме того
система кодирования формул математического языка может быть различной, что выводит за
рамки простого перевода формул в текстовое представление. По этой причине такая задача
является достаточно сложной и в данной версии не рассматривалась.
2.  Большие  трудности  в  создании  системы  синтеза  речи  по  орфографическому  тексту
возникают  при  фонемной  транскрипции  входной  фразы.  Под  фонемной  транскрипцией
понимается перевод единиц орфографического текста в звуковые единицы языка. Сложность
преобразования  «графема–фонема»  для  разных  языков  различна.  Что  касается  татарского
языка,  то  трудности  обусловлены,  прежде  всего,  ненаучным  характером  его  орфографии.
Помимо множества незначительных двусмысленностей в правилах типа «… некатегоричное
будущее время глаголов образуется суффиксом -ыр/ер, а в некоторых  случаях суффиксом –
ар/әр (ит+әр)», в орфографии значится такое правило: «слова, заимствованные письменным
путем из русского языка или через него, пишутся так, как принято в русской орфографии»
[6]. Использование данного ïðàâèëà ïðèâåëî к тому, что в ñëîâàðÿõ òàòàðñêîãî языка около 10-
15%  слов  ñîõðàíÿþò  ÷åðòû  àðàáñêîãî  письма,  а  35-  40%  слов  пишутся  ïî-ðóññêè.  Ðàñõîæäåíèÿ

220

ìåæäó  ãðàôèêîé  и  звуковой  системой  ÿçûêà  îêàçàëиñü  çíà÷èòåëüíûì  è  òðóäíî  ïîääàþùèìñÿ
ñèñòåìàòèçàöèè. В связи с таким положением дел при создании транскрибиратора пришлось
выбирать между следующими альтернативами:


íàó÷èòü  ñèíòåçàòîð  произносить  àðàáñêèå  ñëîâà  ñ  àðàáñêèì  àêöåíòîì,  ðóññêèå  ñëîâà  ïî-
ðóññêè, à òàòàðñêèå – ïî-òàòàðñêè


îçâó÷èâàòü çàèìñòâîâàíèÿ в соответствии с ôîíåòè÷åñêîé системой òàòàðñêîãî ÿçûêà.
Современная  орфография  придерживается  первого  варианта.  Для  того,  чтобы  ïðîèçíîñèòü
ðóññêèå  заимствования  на  языке  îðèãèíàëà,  фонетическая  система  òàòàðñêîãî  языка  была
дополнена  гласными  фонемами  /ō/,  /û/,  /ē/,  согласными  -  /ö/,  /ù/,  /q/,  /g/,  /в/,  а  òàêæå
специальными  символами  "ь"  и  "ъ".  В  результате  современная  графика  татарского  языка
представляет  эклектику  трех  языковых  систем  -  собственно  татарской,  а  также  русской  и
арабской.  Но  это  еще  не  все.  Дополнение  фонетической  системы  татарского  языка  тремя
гласными  и  пятью  согласными  оказалось  недостаточным  для  произношения  всех
заимствований  так,  как  в  оригинале.  Потребуется,  по  крайней  мере,  дополнительное
включение  в  фонетическую  систему  татарского  языка  фонем  /а/  и  /ль/,  а  в  оптимальном
случае - всех русских гласных и согласных. Так, в словах [кабинетка] и [гаражга] фонемы
/а/ в начальном и конечным слогах оказались невзаимозаменяемыми, а слова [тол], [толь] и
[тŏл]  контрастируют  не  только  по  гласным  фонемам.  Данное  обстоятельство  вынудило
разработчиков  отказаться  от  предложенных  лингвистами  орфоэпических  норм  и  выбрать
второй  путь  -    озвучивать  заимствования  в  согласии  с  фонетической  системой  òàòàðñêîãî
языка.
Данный подход предполагает осуществление фонематической транскрипции в два этапа.
На первом этапе необходимо определить  - является ли входное слово заимствованным или
исконно  татарским,  на  втором  –  с  помощью  соответствующего  алгоритма  выполнить  саму
транскрипцию.  Такой  способ  (выполнение  транскрипции  в  два  этапа)  вполне  естественен.
Действительно,  чтобы  правильно  транскрибировать,  к  примеру,  слова  Казан  и  Казань,
капкан  (охотничья  принадлежность)  и  капкан  (проглотил)  необходимо  знать  –  к  каким
языкам они принадлежат, а также обладать знаниями о фонетико-фонологических системах
татарского и русского языков.
Вторая  часть  задачи,  т.е.  собственно  фонематическая  транскрипция,  имеет
непосредственное  отношение  к  фонетике  и  фонологии  языка  и  требует  теоретического
осмысления основных положений соответствующих разделов грамматики.
Основной  единицей  фонологии  является  фонема.  В  фонетике  утверждается  наличие  в
татарском языке 12 гласных и 28 согласных. В татарском языкознании фонема определяется
как «неделимые звуковые единицы языка, которые служат для построения словоформ и для
различения звуковых видов»[6]. Выделение фонем производится на основании правила: «Если
два звука, находящиеся в одинаковых фонетических позициях (одинаковость фонетической
позиции  включает  и  одинаковость  контекста),  позволяют  различить  смысл  слов,  то  они
являются  различными  фонемами».  При  этом  «одинаковость»  или  «неодинаковость»
фонетической  позиции  звука  устанавливается  на  основе  графического  представления  слов.
Предполагается,  что  смысл  слова  в  речевой  коммуникации  устанавливается  в  результате
опознавания  составляющих  его  фонем.  Так,  считается,  что  в  паре  "тŏл  (вдовый)"  -  "тōл
(взрывчатое  вещество)"  гласные  ŏ  и  ō,  имеют  одинаковую  фонетическую  позицию,  а
значения  слов  различаются  за  счёт  фонемной  идентификации  звуков.  На  основе  данных
воззрений  в  татарском  языке  выделяются  широкие  (произносимые  при  более  широком
растворе рта) гласные /ō/, /ы/, /ēе/, а также согласные фонемы /ц/, /щ/, /в/, /к’/, /г’/.
Между  тем  трудно  говорить  о  фонетическом  равенстве  слов,  принадлежащим  разным
звуковым  системам.  Как  пишет  Л.Р.  Зиндер:  "Совокупность  фонем  данного  языка
представляет  не  простой  набор  разрозненных  единиц.  Фонемы  находятся  в  определенных
отношениях  друг  к  другу,  определенным  образом  связаны  между  собой,  составляя
известную систему" [7].

221

Что  касается  различения  смысла  слова,  то  «достаточно  часто  фонемное  решение
принимается  не  на  основе  фонетической  информации,  а  в  результате  опознавания
морфологической  структуры  слова,  синтаксических  связей  в  словосочетании,  наконец,
смысла всего высказывания» [8]
Для  наших  целей
4
  фонемный  состав  татарского  языка  определялся  на  основе
теоретических положений Л.В. Щербы, В.А. Богородицкого и их последователей. В [9] Л.В.
Щерба определяет фонему как "... кратчайшее общее фонетическое представление данного
языка,  способное  ассоциироваться  со  смысловыми  представлениями  и  дифференцировать
слова и могущее быть выделяемо в речи без искажения фонетического состава слова...".
Опираясь  на  данное  понимание  сущности  фонемы  и  учитывая  роль  речевых  звуков  в
передаче значений, при создании транскриптора в звуковой системе татарского языка было
выделено 9 гласных (/а/, /ә/, /о/, /ө/, /у/, /ү/, /ы/, /е/, /и/) и 23 согласных фонем (/б/, /в/, /г/, /д/,
/ж/, /з/, /й/, /к/, /л/, /м/, /н/, /п/, /р/, /с/, /т/, /ф/, /х/, /ш/, /ч/, /җ/, /ң/, /һ/, /w/. Очевидно, что состав
фонем  любого  языка  должен  удовлетворять  условиям  необходимости  и  достаточности  для
различения  лексических  и  грамматических  значений.  Проверка  этих  положений  на
множестве грамматических морфем показала, что данный состав фонем удовлетворяет этим
условиям.
Вторая проблема, связанная с транскрипцией орфографических текстов татарского языка,
заключается  в  решении  вопроса  –  как  транскрибировать  заимствования.  Другими  словами,
"научить" ли  синтезатор произносить арабские слова с  арабским акцентом, русские слова  -
по-русски,  а  татарские  -  по-татарски  либо  озвучивать  заимствования  согласно  фонетике
спонтанной, не укладывающейся в рамки нормативной граматики, татарской речи.
Если  бы  заимствования  в  лексике  татарского  языка  были  единичными,  то  вопрос  -  как
писать  заимствования  –  потерял  бы  свою  актуальность.  Но  они  многочисленны.  В  лексике
современного  татарского  языка  русские  заимствования  составляют  более  40%  (в
составляющемся  электронном  словаре  из  26000  основ  слов  12000  оказались
неадаптированными
русскими
заимствованиями),
арабские
заимствования
(неадаптированные  или  частично  адаптированные)  составляют  около  10%[11].    Тексты
деловых бумаг, научного и публицистического стилей приблизительно на 25% покрываются
заимствованиями  из  русского  языка.  Произносить  эти  слова  по-русски  при  помощи
включенных в фонологическую систему татарского языка семи  – восьми русских фонем не
представляется возможным. В звуковой картине слова корабль [карàбъл’] по-русски звучит
не  только  /к/,  но  и  ударная  и  безударная  /а/,  а  также  согласные  /б/  и  /л/.  По-видимому,
«пересаживать»  часть  фонем  одной  системы  звуков  в  другую  систему  невозможно.  Как
пишет В.А.Богородицкий:   "… звуковая система  каждого языка представляет не простое
собрание  звуков,  но  гармонически  связанное  целое,  …полагаю,  что  только  что  указанная
особенность  физиологическая  и  акустическая  гласного  /а/  (более  задняя  артикуляция  по
сравнению  с  русской  /а/.)  может  находиться  в  связи  с  более  глубоким  произношением
татарского /к/ и /г/" [10].
При написании алгоритма фонематической транскрибирации, было принято решение, что
действие закона сингармонизма, лежащее в основе фонетической системы татарского языка,
распространяется в заимствованиях не на целое слово, а на слог. Слог как произносительная
единица может быть только целиком палатилизованным или целиком непалатилизованным,
а  в  слове  могут  встречаться  как  палатилизованные,  так  и  непалатилизованные  слоги.  С
учетом  вышесказанного,  предложение  "Комендантка  слесарьларны  эзләп  ике  тапкыр
гаражга барырга туры килде. (В поисках слесарей коменданту пришлось дважды сходить в
гараж)"  после  транскрипции  приобрело  вид [Кәминдантка  эслисарларны  эзләп  ике  тапкыр
гәражга барырга туры килде].
Значительное затруднение в произнесении заимствований так, как они звучат в языках, из
которых заимствуются, вносит и то обстоятельство, что образование грамматических форм и

4
изучение звуковой системы языка в целях внедрения его в новые информационные технологии

222

сложных  слов  от  основ-заимствований  происходит  путем  присоединения  аффиксов  к
основам  из  различных  языков  (колхоз+чыларга,  аэро+чана+лар).  Согласование  основ  и
аффиксов  на  сегментном  и  супрасегментном  уровнях,  как  правило,  не  представляется
возможным.  Алгоритм  фонематической  транскрипции  разбивает  словоформу  на  три  части
основа+основа+аффиксное  окончание  (газ+үлчәгеч+ләрне),  причем  первая  основа  может
отсутствовать
5
.  Для  каждой  основы  определяется  язык  происхождения,  и  далее
транскрибирование  каждой  основы  осуществляется  по  соответствующему  набору  правил.
Что  же  касается  окончания,  то  мягкость/твердость  гласных  определяется  анализом
последней  гласной  предваряющей  основы.  Заметим,  что  если  в  основе  словоформы
встречается  единственная  гласная  /и/,  то  вид  окончания  определяется  принадлежностью
языку-основы(спирт [спирт+ны], грипп [грип+ны], кил [кил+ә+ләр]).
С  учетом  изложенного  алгоритм  фонематической  транскрипции  заимствований
разрабатывался  на  базе  установленного  состава  фонем  и  в  соответствии  с  фонетикой
спонтанной татарской речи. Фонетика спонтанной речи (под термином «татарский народный
говор») достаточно полно описано В.А.Богородицким в [10].
3.
Фонетическая
транскрипция
состоит
в
преобразовании
фонематически
транскрибированного  слова  входного  предложения  к  форме  его  звучания  (с  учетом
контекстного  окружения)  на  выходной  фразе.  Алгоритм  транскрипции  состоит  из  трех
частей, включающих формирование звуковой оболочки слогов, стыков слогов и стыков слов,
объединенных  в  ритмические  группы[12].  В  формировании  звуковой  оболочки  слогов
основное  внимание  уделялось  изменениям  длительностей  гласных  в  речевом  потоке  в
зависимости от их характеристик (краткий/долгий) и позиции в слове, а также в РГ.
Наиболее значимыми в этом плане являются изменения в длительностях кратких гласных,
таких  как  [ы],  [е],  [о],  [ө].  Так,  гласные  сокращаются  полностью  (тешем  –  тшем,  белән  –
блән) в тех случаях, когда[13]:
а) гласные [ы] и [е] входят в состав слогов типа СГ,
б) согласный (С) является взрывным либо шипящим,
в) данный слог находится в начале слова,
г) за слогом СГ следует слог, начинающийся на сонорный либо на шипящий.
Если  не  выполняется  условие  г),  то  гласный  слога  СГ  сокращается  почти  до  полного
исчезновения  (чыдам  [чдам],  кыяр  [кйар]).  Если  не  выполняется  условие  в),  то  возможны
два  варианта:  1)  в  случае,  когда  СГ  употребляется  в  середине  слова,  гласные  [ы]  и  [е]
сокращаются  лишь  наполовину,  2)  в  случае,  когда  СГ  употребляется  в  конце  слова
(ритмической группы), то сокращение вовсе и не происходит. Указанные явления могут быть
объяснены с позиции действия фактора удобопроизнесения.
Алгоритм  формирования  звучания  стыков  слов,  входящих  в  одну  РГ,  предназначен  для
описания фонетических явлений, наблюдаемых при объединении слов в одно фонетическое
целое.  В  разработанном  алгоритме  рассматриваются  случаи  объединения  слов,  когда
предшествующее  слово  заканчивается,  а  следующее  начинается  на  одинаковые  гласные,
разные  гласные,  согласный  и  гласный,  а  также  -  на  согласные.  Алгоритм  учитывает
изменение качества речевого звука либо замену одного звука другим в составе пограничных
фонем.  Основное  внимание  при  этом  было  уделено  ассимиляциям  пограничных  фонем  по
признаку  "звонкость  -    глухость".  Примеры:  башсыз  -  башшыз  (безголовый),  тозсыз  -
тоссыз  (несоленый),  бỳдка  –  буткы,  аяк  асты  -  аягасты  и  т.д.  В  противоположность
ассимиляциям  по  месту  образования  (урман+лар=урман+нар),  ассимиляции  по  признаку
"звонкость -  глухость" являются более значимыми в обеспечении качественного синтеза.
4.  Ритмико-интонационное  оформление  фразы  является  одной  из  основных  и  трудно
решаемых  задач  в  разработке  любого  синтезатора.  В  татарском  языке  в  отсутствие
словесного  ударения  основную  роль  в  формировании  ритмико-мелодической  структуры

5
Вообще говоря, основ может быть и более двух, но в этом случае транскрипция строится через словари

223

высказывания  играет  ритмическая  группа  (речевой  такт,  ритмическая  структура,
фонетическое слово), точнее - разбиение фразы на ритмические группы.
Исследования  показали[14],  что  распределение,  как  интенсивности,  так  и  длительности
слогов  в  речевом  такте  подчиняется  определенным  закономерностям.  Произнесение
ритмической группы имеет более энергичное начало и несколько расслабленное завершение,
вследствие чего длительности слогов к концу речевого такта несколько увеличиваются.
Так, анализ конечных ритмических групп во фразах с интонацией завершенности выявил
следующие закономерности:
1.

Длительность гласного конечного открытого слога в два раза больше длительности
гласного  начального  слога  данной  ритмической  группы.  Интенсивность  конечного  слога,
независимо  от  того  является  ли  он  открытым  или  закрытым,  примерно  на  25%  меньше
интенсивности начального слога. Интенсивность конечного открытого слога речевого такта,
находящегося в конце фразы, в отличие от  интенсивности аналогичного слога внутреннего
речевого такта постепенно падает и сводится к нулю.
2.

Когда конечной слог является закрытым, то различия в длительностях начального и
конечного  слогов  ритмической  группы  не  наблюдаются.  Отличия  по  интенсивности
сохраняются.  Интенсивность  последнего  слога  примерно  на  25%  ниже  интенсивности
первого слога.
Согласно  нашему  предположению,  интонация  общего  вопроса  также  сосредоточена  в
конечной  ритмической  группе  фразы.  Отчасти  это  обусловлено  особенностями  татарского
языка.  В  отличие  от  русского  в  татарском  языке  процедура  организации  общего  вопроса,
кроме интонации, предполагает участие грамматических форм – частицы -мы/-ме и -мыни/-
мени. Данные частицы присоединяются к любой части речи, выполняющей в предложении
функцию  сказуемого.  Согласно  синтаксису  татарского  языка,  сказуемое  находится  в  конце
предложения.  Эти  особенности  позволили  изучать  в  сопоставительном  плане  такие  фразы
как,  например,  "Бу  камыш  исеме?  (Это  запах  камыша?)"  и  "Бу  килеш  исеме.  (Это  имя
падежа.)", "Ул арыш саламы? (Он кладет рожь?)" и "Бу арыш саламы. (Это ржаная солома?)"
Выявлено,  что  вопросительная  частица  -мы/-ме  отличается  от  неморфемных  сочетаний
"мы"  и  "ме"  несколько  большей  длительностью  и  интенсивностью,  а  также  конечным
участком  гласных  "ы"  и  "е".  У  неморфемных  сочетаний  звучание  данных  гласных  плавно
переходит на нет, в то время как  у частиц звучание заканчивается на том месте, в котором
интенсивность звука является значительной.
В  настоящее  время  просодический  анализ  производится  на  основе  знаков  препинания  в
предложении. Выделение границ всех ритмических групп предложения требует полного его
синтаксического анализа.
5. В разработке синтезаторов речи конкатенативного типа важное значение имеет выбор
речевой  единицы  в  качестве  исходного  элемента  конкатенации.  Первоначально  была
предпринята попытка сформировать элементную базу из слогов. Расчет был таков, что слоги
как  наименьшие  единицы  артикуляции  представляют  более  целостную  структуру  и
количество  их  в  татарском  языке  существенно  меньше,  чем  в  русском  или  английском
языке[15].  Вскоре,  однако  выяснилось,  количество  слогов,  выявленных  на  основе  анализа
изолированных  слов  значительно  меньше  того  объема,  которого  мы  получили  бы  на  базе
анализа предложений и фраз. Кроме того выяснилось, что слоги как просодические единицы
несут  в  себе  различного  рода  дополнительную  окраску,  которых  трудно  учесть  при
озвучивании текста. Современная версия синтезатора использует дифонную базу.
В процессе создания дифонной базы были выполнены следующие виды работ:
1.

Построена  таблица  сочетаемостей  фонем  с  учетом  пробела  между  словами,
состоящая из 33 строк (32 фонемы и плюс «пробел») и такого же количества столбцов.
2.

Выделены фонемные сочетания, способные следовать в начале слова, середине слова
и  в  его  конечной  позиции  (на  основе  табличных  данных).  Общее  количество  данных  трех
классов фонемосочетаний составляет порядка 3000 единиц.

224

3.

Выявлено,  что  помимо  представительства  указанных  классов  фонологических
структур,  элементная  база  синтезатора  включает  репрезентанты  фонемосочетаний,
встречающихся  на  стыках  слов,  в  конечной позиции  предложений,  а  также  слова  длиной  в
одну и две фонемы. (ә, ат, ит, өч, ки и т.д.).
4.

Создание дифоной базы на основе выделенных фонемосочетаний производилось по
следующей схеме:
а) В составе псевдофраз нужное фонемосочетание было озвучено диктором и оцифровано.
Псевдофраза состояла из трех ритмических групп, одна из которых представляла 3–х или 4–х
сложное  квазислово  (слово,  лишенное  смысла,  но  имеющее  характерное  для  татарского
языка звучание)
б)  Программным  путем  устанавливались  границы  входящих  в  дифон  фонем,  а  затем
границы дифона.
в) Аудированием в различных контекстах проводилась оценка качества звучания дифона.
г) Выполнялась разметка периодов основного тона содержащихся в базе дифонов.
д) Производилась конвертация дифона в базу данных синтезатора.
На  настоящее  время  элементная  база  синтезатора  содержит  2370  дифонов.  Увеличение
элементной базы, замена отдельных дифонов более качественными по мере необходимости
будут продолжаться.
Алгоритмы  озвучивания  построены  на  известной  технологии  TD-PSOLA.  Этот  подход
позволяет  производить  модификацию  просодических  характеристик  базовых  элементов,
размеченных по периодам основного тона.

жүктеу/скачать 8,57 Mb.

Достарыңызбен бөлісу:

1 ... 21 22 23 24 25 26 27 28 ... 39