Пикалёв Я. С., Ермоленко Т. В.
Проблемы искусственного интеллекта 2019 № 4 (15)
46
П
Выводы
Проведено исследование относительно фонемного
состава русского языка, в
результате которого были выделены особенности его произношения.
Проанализированы существующие подходы к задаче фонемного транскрибиро-
вания генерации транскрипции слов, выделены преимущества и недостатки каждого
подхода.
Обучена и протестирована работа нейросетевой модели генерации транскрипций
для слов-исключений. Архитектура модифицирована за счёт применения техник clip
gradient, teacher forcing и увеличения количества блоков в енкодере и декодере. Как
показали численные исследования, предложенная техника модернизации моделей
типа sequence-to-sequence на основе внесения изменений в структуру алгоритма
построения позволила повысить точность обученной модели генерации транс-
крипций для слов-исключений по критерию PER на 9%, по критерию WER на – 3%.
Список
литературы
1. Панов М. В. Современный русский язык. Фонетика: учебник для ун-тов [Текст] / Панов М. В. – М. :
Высш. Школа, 1979. – 256 с.
2. Валгина Н. С. Современный русский язык [Текст] / Н. С. Валгина, Д. Э. Розенталь, М. И. Фомина. –
Логос, 2006.
3. Малышева Е. Г. Современный русский язык. Фонетика. Орфоэпия: учебное пособие [Текст] /
Е. Г. Малышева, О. С. Рогалева. – Омск : Изд-во Ом. гос. ун-та, 2012.
4. Князев С. В. Современный русский литературный язык: фонетика, орфоэпия, графика, орфография
[Текст] / С. В.Князев, С. К. Пожарицкая. – 2011. – С. 432–432.
5. Гируцкий А. А. Введение в языкознание [Текст] / А. А. Гируцкий ; [рецензенты: к.фил.н., доц.
Е. С. Садовская, к.фил.н., доц. Ж. С. Спливеня]– Минск : Вышэйшая школа, 2016. – 238 с.
6. Грищенко А. Фонетика современного русского литературного языка (Фонетика. Фонология.
Орфоэпия. Графика. Орфография) [Текст] / А. Грищенко, М. Попова. – Litres, 2019.
7. Кривнова О.Ф. Многофункциональный автоматический транскриптор русских текстов [Текст] /
О. Ф. Кривнова, Л.М. Захаров, Г.С. Строкин // Труды Международного конгресса исследователей
русского языка. – М. – 2001.
8. Hunnicutt S. Grapheme-to-phonemerules: Areview [Текст] / S. Hunnicutt // Speech Transmission
Laboratory, Royal Institute of Technology, Stockholm, Sweden, QPSR 2-3. – 1980. – Pp. 38–60.
9. Смирнов В.А.
Функция лингвистического процессора в системе автоматического анализа не-
структурированной речевой информации [Текст] / В.А. Смирнов, М.Н. Гусев, М.П. Фархадов//
Автоматизация и современные технологии. – № 8. – 2013. – С. 20–28.
10. Bisani M. Joint-sequence models for grapheme-to-phoneme conversion [Текст] / M. Bisani, H. Ney //
SPECOM. – 2008.
11. Novak J. WFST-based Grapheme-to-Phoneme Conversion: Open
Sourse Tools for Alignment, Model-
Building and Decoding [Текст] /J. Novak, N. Minematsu, K. Hirose // Proceedings of the 10th
International Workshop on Finite State Methods and Natural Language Processing. – 2012. – Pp.45–49.
12. Sun, Hao, et al. Token-Level Ensemble Distillation for Grapheme-to-Phoneme Conversion[Текст] /Sun,
Hao, et al. //arXiv preprint arXiv:1904.03446. – 2019.
13. Yolchuyeva, Sevinj, GézaNémeth, and BálintGyires-Tóth. Transformer based Grapheme-to-Phoneme
Conversion[Текст] /Yolchuyeva, Sevinj, GézaNémeth, and BálintGyires-Tóth // Proc. Interspeech 2019. –
2019. – 2095-2099.
14. Karanikolas, Nikitas N. Machine learning of phonetic transcription rules for Greek [Текст] / Karanikolas,
Nikitas N. // AIP Conference Proceedings. – Vol. 2116, No. 1. – AIP Publishing, 2019.
15. Huang, Qiang. Detecting Mismatch Between Speech and Transcription Using Cross-Modal
Attention}}[Текст] / Huang, Qiang, and Thomas Hain // Proc. Interspeech 2019. – 2019. – Pp. 584-588.
16. Jůzová, Markéta. Using Auto-Encoder BiLSTM Neural Network for Czech Grapheme-to-Phoneme
Conversion [Текст] / Jůzová, Markéta, and Jakub Vít // International
Conference on Text, Speech, and
Dialogue. – Springer, Cham, 2019.
Система автоматической генерации транскрипций русскоязычных слов-исключений…
Problems of Artificial Intelligence 2019 № 4 (15)
47
В
П
17. Ponomareva, Maria, et al. Automated word stress detection in russian [Текст] / Ponomareva, Maria, et al. //
arXiv preprint arXiv:1907.05757. – 2019.
18. Algorithms for automatic accentuation and transcription of russian texts in speech recognition systems
[Текст] / Yakovenko O., Bondarenko I., Borovikova M., Vodolazsky D. // Karpov A., Jokisch O.,
Potapova R. (eds.) SPECOM 2018. LNCS (LNAI). – Vol. 11096. – Pp. 768–777.
19. Кипяткова И.С. Модуль фонематического транскрибирования для системы распознавания
разговорной русской речи [Электронный ресурс] / И.С. Кипяткова, А.А. Карпов // Искусственный
интеллект. – 2008. – URL: http://www.nbuv.gov.ua/ portal/natural/ii/2008_4 /JournalAI_2008_4/
Razdel9/00_Kipyatkova_Karpova.pdf
20. Yanushevskaya Irena; Bunčić, Daniel. Russian [Текст] / Yanushevskaya, Irena; Bunčić, Daniel //Journal of the
International Phonetic Association. –2015. – № 45 (2). – Pp. 221–228, doi:10.1017/S0025100314000395.
21. Sutskever, I., O. Vinyals, and Q. V. Le. Sequence to sequence learning with neural networks [Текст] /
Sutskever, I., O. Vinyals, and Q. V. Le. – Advances in NIPS, 2014.
22. Toshniwal, Shubham, and Karen Livescu. Jointly learning to align and convert graphemes to phonemes
with neural attention models. 2016 [Текст] / Toshniwal, Shubham, and Karen Livescu //
IEEE Spoken
Language Technology Workshop (SLT). – IEEE, 2016.
23. G2PwithTensorflow [Электронный ресурс]. – URL: https://github.com/cmusphinx/g2p-seq2seq (дата
обращения: 16.05.2019)
24. Lee, Younggun, and Taesu Kim. Learning pronunciation from a foreign language in speech synthesis
networks." [Текст]/Lee, Younggun, and Taesu Kim //arXiv preprint arXiv:1811.09364, – 2018.
25. Attention is all you need. [Текст] / Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez,
A. N., ...&Polosukhin, I. // Advances in neural information processing systems. – 2017.Pp. 5998-6008.
26. Morphological analyzer and generator for Russian and Ukrainian languages [Текст] /Korobov M. //
International Conference on Analysis of Images, Social Networks and Texts. – Springer, Cham, 2015. –
С. 320-332.
References
1. Panov M. V.
Sovremennyirusskyiyazyk. Fonetika :Uchebnikdlya un-tov [Century. Modern Russian
language. Phonetics: A Textbook for University], M.,Vysh. Shkola, 1979, pp. 256.
2. Valgina N. S., Ditmar E. R., Fomina M. I.
Sovremennyi russkyi yazyk [Modern Russian language],
Logos, 2006.
3. Malysheva, E. G., Rogaleva O. S.
Sovremennyi russkyi yazyk. Fonetika. Orfoepiya: уuchebnoe posobie
[Modern Russian language. Phonetics. Orthoepy: study guide], Omsk, Izd-vo Om.gos. un-ta, 2012.
4. Knyazev S. V., Pozharitskaya S. K.
Sovremennyi russkyi literaturnyi yazyk: fonetika, orfoepiya, grafika,
Достарыңызбен бөлісу: