I. Системы и средства искусственного интеллекта issn 2413-7383 Problems of Artificial Intelligence 2019 №4 (15) 35 П



Pdf көрінісі
бет5/7
Дата04.04.2023
өлшемі0,6 Mb.
#79087
1   2   3   4   5   6   7
list



]
[
]...
0
[
N
rew
rew
rew
end
end
end


(12) 
9. Получение среднего reward (
mean
rew

N
i
rew
rew
N
i
end
mean



1
]
[

(13) 
10. Пересчитывается loss для forward-transformer, на основе которых перестраивается 
модель.
mean
loss
rl
rew
forw
loss


(14) 
11. Используя 
rl
loss  для алгоритма обратного распространения ошибки, про-
исходит коррекция весов модели forward_RL-transformer. 
Результаты численных исследований 
Для обучения модели генерации транскрипции для слов-исключений был собран 
набор данных, состоящий из слов, отличающихся от фонетических норм русского 
языка. Данный набор был расширен за счёт генерации парадигм для исходных слов при 
помощи морфоанализатора pymorphy2. Сгенерированные парадигмы были просмотрены 
авторами и удалены их неверные варианты. Общий объём слов составил около 10 тыс. 
Для оценки результатов использовались метрики: WER – отношение количества 
неверно трансформированных слов к общему количеству слов (Word Error Rate) и PER – 
отношение количества неверно трансформированных символов к общему количеству 
символов (Phoneme Error Rate).
Результаты тестирования разработанной нейросетевой модели для генерации 
транскрипций слов-исключений приведены на рис. 8, где рис. 8а – зависимость loss-
функций от количества эпох; рис. 8б – зависимость метрик WER от количества эпох; 
рис. 8в – зависимость метрик PER от количества эпох. 
Рисунок 8 – Результаты тестирования сети PhonExcNN 


Пикалёв Я. С., Ермоленко Т. В. 
Проблемы искусственного интеллекта 2019 № 4 (15)
46
П 
Выводы 
Проведено исследование относительно фонемного состава русского языка, в 
результате которого были выделены особенности его произношения. 
Проанализированы существующие подходы к задаче фонемного транскрибиро-
вания генерации транскрипции слов, выделены преимущества и недостатки каждого 
подхода. 
Обучена и протестирована работа нейросетевой модели генерации транскрипций 
для слов-исключений. Архитектура модифицирована за счёт применения техник clip 
gradient, teacher forcing и увеличения количества блоков в енкодере и декодере. Как 
показали численные исследования, предложенная техника модернизации моделей 
типа sequence-to-sequence на основе внесения изменений в структуру алгоритма 
построения позволила повысить точность обученной модели генерации транс-
крипций для слов-исключений по критерию PER на 9%, по критерию WER на – 3%. 
Список литературы 
1. Панов М. В. Современный русский язык. Фонетика: учебник для ун-тов [Текст] / Панов М. В. – М. : 
Высш. Школа, 1979. – 256 с. 
2. Валгина Н. С. Современный русский язык [Текст] / Н. С. Валгина, Д. Э. Розенталь, М. И. Фомина. – 
Логос, 2006. 
3. Малышева Е. Г. Современный русский язык. Фонетика. Орфоэпия: учебное пособие [Текст] / 
Е. Г. Малышева, О. С. Рогалева. – Омск : Изд-во Ом. гос. ун-та, 2012. 
4. Князев С. В. Современный русский литературный язык: фонетика, орфоэпия, графика, орфография 
[Текст] / С. В.Князев, С. К. Пожарицкая. – 2011. – С. 432–432. 
5. Гируцкий А. А. Введение в языкознание [Текст] / А. А. Гируцкий ; [рецензенты: к.фил.н., доц. 
Е. С. Садовская, к.фил.н., доц. Ж. С. Спливеня]– Минск : Вышэйшая школа, 2016. – 238 с. 
6. Грищенко А. Фонетика современного русского литературного языка (Фонетика. Фонология. 
Орфоэпия. Графика. Орфография) [Текст] / А. Грищенко, М. Попова. – Litres, 2019. 
7. Кривнова О.Ф. Многофункциональный автоматический транскриптор русских текстов [Текст] / 
О. Ф. Кривнова, Л.М. Захаров, Г.С. Строкин // Труды Международного конгресса исследователей 
русского языка. – М. – 2001.
8. Hunnicutt S. Grapheme-to-phonemerules: Areview [Текст] / S. Hunnicutt // Speech Transmission 
Laboratory, Royal Institute of Technology, Stockholm, Sweden, QPSR 2-3. – 1980. – Pp. 38–60.
9. Смирнов В.А. Функция лингвистического процессора в системе автоматического анализа не-
структурированной речевой информации [Текст] / В.А. Смирнов, М.Н. Гусев, М.П. Фархадов// 
Автоматизация и современные технологии. – № 8. – 2013. – С. 20–28. 
10. Bisani M. Joint-sequence models for grapheme-to-phoneme conversion [Текст] / M. Bisani, H. Ney // 
SPECOM. – 2008. 
11. Novak J. WFST-based Grapheme-to-Phoneme Conversion: Open Sourse Tools for Alignment, Model-
Building and Decoding [Текст] /J. Novak, N. Minematsu, K. Hirose // Proceedings of the 10th 
International Workshop on Finite State Methods and Natural Language Processing. – 2012. – Pp.45–49. 
12. Sun, Hao, et al. Token-Level Ensemble Distillation for Grapheme-to-Phoneme Conversion[Текст] /Sun, 
Hao, et al. //arXiv preprint arXiv:1904.03446. – 2019. 
13. Yolchuyeva, Sevinj, GézaNémeth, and BálintGyires-Tóth. Transformer based Grapheme-to-Phoneme 
Conversion[Текст] /Yolchuyeva, Sevinj, GézaNémeth, and BálintGyires-Tóth // Proc. Interspeech 2019. – 
2019. – 2095-2099. 
14. Karanikolas, Nikitas N. Machine learning of phonetic transcription rules for Greek [Текст] / Karanikolas, 
Nikitas N. // AIP Conference Proceedings. – Vol. 2116, No. 1. – AIP Publishing, 2019. 
15. Huang, Qiang. Detecting Mismatch Between Speech and Transcription Using Cross-Modal 
Attention}}[Текст] / Huang, Qiang, and Thomas Hain // Proc. Interspeech 2019. – 2019. – Pp. 584-588. 
16. Jůzová, Markéta. Using Auto-Encoder BiLSTM Neural Network for Czech Grapheme-to-Phoneme 
Conversion [Текст] / Jůzová, Markéta, and Jakub Vít // International Conference on Text, Speech, and 
Dialogue. – Springer, Cham, 2019. 


Система автоматической генерации транскрипций русскоязычных слов-исключений… 
Problems of Artificial Intelligence 2019 № 4 (15) 
47
В 
П 
17. Ponomareva, Maria, et al. Automated word stress detection in russian [Текст] / Ponomareva, Maria, et al. // 
arXiv preprint arXiv:1907.05757. – 2019. 
18. Algorithms for automatic accentuation and transcription of russian texts in speech recognition systems 
[Текст] / Yakovenko O., Bondarenko I., Borovikova M., Vodolazsky D. // Karpov A., Jokisch O., 
Potapova R. (eds.) SPECOM 2018. LNCS (LNAI). – Vol. 11096. – Pp. 768–777. 
19. Кипяткова И.С. Модуль фонематического транскрибирования для системы распознавания 
разговорной русской речи [Электронный ресурс] / И.С. Кипяткова, А.А. Карпов // Искусственный 
интеллект. – 2008. – URL: http://www.nbuv.gov.ua/ portal/natural/ii/2008_4 /JournalAI_2008_4/ 
Razdel9/00_Kipyatkova_Karpova.pdf 
20. Yanushevskaya Irena; Bunčić, Daniel. Russian [Текст] / Yanushevskaya, Irena; Bunčić, Daniel //Journal of the 
International Phonetic Association. –2015. – № 45 (2). – Pp. 221–228, doi:10.1017/S0025100314000395. 
21. Sutskever, I., O. Vinyals, and Q. V. Le. Sequence to sequence learning with neural networks [Текст] / 
Sutskever, I., O. Vinyals, and Q. V. Le. – Advances in NIPS, 2014. 
22. Toshniwal, Shubham, and Karen Livescu. Jointly learning to align and convert graphemes to phonemes 
with neural attention models. 2016 [Текст] / Toshniwal, Shubham, and Karen Livescu // IEEE Spoken 
Language Technology Workshop (SLT). – IEEE, 2016. 
23. G2PwithTensorflow [Электронный ресурс]. – URL: https://github.com/cmusphinx/g2p-seq2seq (дата 
обращения: 16.05.2019) 
24. Lee, Younggun, and Taesu Kim. Learning pronunciation from a foreign language in speech synthesis 
networks." [Текст]/Lee, Younggun, and Taesu Kim //arXiv preprint arXiv:1811.09364, – 2018. 
25. Attention is all you need. [Текст] / Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, 
A. N., ...&Polosukhin, I. // Advances in neural information processing systems. – 2017.Pp. 5998-6008. 
26. Morphological analyzer and generator for Russian and Ukrainian languages [Текст] /Korobov M. // 
International Conference on Analysis of Images, Social Networks and Texts. – Springer, Cham, 2015. – 
С. 320-332. 
References 
1. Panov M. V. Sovremennyirusskyiyazyk. Fonetika :Uchebnikdlya un-tov [Century. Modern Russian 
language. Phonetics: A Textbook for University], M.,Vysh. Shkola, 1979, pp. 256. 
2. Valgina N. S., Ditmar E. R., Fomina M. I. Sovremennyi russkyi yazyk [Modern Russian language], 
Logos, 2006. 
3. Malysheva, E. G., Rogaleva O. S. Sovremennyi russkyi yazyk. Fonetika. Orfoepiya: уuchebnoe posobie 
[Modern Russian language. Phonetics. Orthoepy: study guide], Omsk, Izd-vo Om.gos. un-ta, 2012. 
4. Knyazev S. V., Pozharitskaya S. K. Sovremennyi russkyi literaturnyi yazyk: fonetika, orfoepiya, grafika, 


Достарыңызбен бөлісу:
1   2   3   4   5   6   7




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет