Атты І халықаралық конференция ЕҢбектері



Pdf көрінісі
бет245/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   241   242   243   244   245   246   247   248   ...   326
3. Синтез эталонов слов 
Эталоны  слов  распознаваемого  словаря  формируются  из  эталонов  дифонов,  полная  база 
которых  в  объеме  приблизительно  трех  тысяч  создается  для  каждого  диктора  заранее    [9]. 
Отметим, что создание такой базы в дальнейшем избавляет пользователя от необходимости 
создавать какие-либо эталоны голосом. 
Под дифоном, соответствующим межфонемному переходу внутри слова, будем понимать 
участок стандартной длины: 3 окна в 368 отсчетов слева от метки между звуками и 3 таких 
же  окна  справа  от  той  же  метки.  Эталон  дифона  –  набор  6-ти  соответствующих  векторов. 
Кроме того, мы используем участок в 3 окна в начале слова и участок в 3 окна в конце слова,  
условно называя их соответственно начальным и конечным полудифоном слова (переход от 
молчания  к  речи  и  наоборот).  Все  вектора,  входящие  в  эталоны  дифонов,  играют  роль 
кодовых  векторов  и  образуют  кодовую  книгу  B.  Все  эталоны  дифонов  нумеруются, 
нумеруются также все кодовые вектора. 
Каждое  слово  словаря  автоматически  транскрибируется,  по  транскрипции  строится 
цепочка  имен  дифонов.  Каждое  из  них  заменяется  эталоном  соответствующего  дифона. 
Полученная цепочка векторов образует эталон слова [9].  
 
Тестирование 
В  результате  работы  была  построена  система,  распознающая  слова  по  эталонам, 
синтезированных из дифонов. 
В  тестировании  данной  системы  участвовали  5  дикторов.  Для  каждого  из  них  были 
созданы собственные  дифонные базы двух видов: база состоящая из 500 дифонов, в которой 
каждое звукосочетание имеет только один аналог, и полная база, состоящая из 1000 дифонов, 
в которой согласные звукосочетания имеют по 4 варианта. После  создания дифонной базы, 
дикторы произносили по 50 слов по два раза: для распознавания слов на основе  неполной 
дифонной  базы  и  для  распознавания    слов  на  основе  полной  дифонной  базы.  В  результате 
распознавание слов на основе полной дифонной базы оказалось надежнее примерно на 15%.  
Полный результат эксперимента представлен в таблице 6. 
 
Таблица 6. Результаты распознавания слов  


Достарыңызбен бөлісу:
1   ...   241   242   243   244   245   246   247   248   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет