ббк76. 0 Қ 54 Редакционная коллегия



Pdf көрінісі
бет14/57
Дата03.03.2017
өлшемі14,62 Mb.
#5946
1   ...   10   11   12   13   14   15   16   17   ...   57

«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



90 

 

 



Рисунок 1 – Таблица тезауруса 

 

Для  построения  онтологической  базы  знаний  учебника  «Java  Промышленное 



программирование»  применяется  программный  редактор  Protégé,  который  является  самым 

удобным для проектирования подобных базы знаний по сравнению с другими аналогичными 

редакторами. 

Для 


разработки 

онтологической 

базы 

знаний 


использовались 

следующие 

инструменты Protégé: 

1) Class – классы; 

2) ObjectProperties – отношения; 

3) Individuals – индивиды; 

4) Ontograf – построение онтографа. 

После того, как программа установлена, запустим ее (рисунок 2) 

 

Рисунок 2 – Запуск программы Protégé 



 

Онтологическая БЗ –Java Промышленное программирование (рисунок 3): 

 


«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



91 

 

 



Рисунок 3 - Онтологическая БЗ –Java Промышленное программирование 

 

Вкладка  Классы  позволяет  добавлять  основные  объекты  предметной  области  в 



иерархической структуре, т.е. позволяет строить классы родительские и дочерние. 

Самым  главным  родительским  классом  является  класс  Thing,  который  означает                 

«Вещь» – сущность, которая является стандартным корневым элементом в OWL онтологии. 

В левой панели, есть Субпанель, в котором располагаются классы в виде дерева. При 

открытии  Субпанель  обычно  начинается  с  дерева  в  свернутом  режиме.  Тем  не  менее,  если 

есть  вложенные  элементы  ниже  в  дереве,  показывается  стрелка  вправо.  При  нажатии  на 

стрелку дерево раскрывается и показываются поддеревья и классы (рисунок 4): 

 

 



Рисунок 4 – Вкладка Классы 

 

Онтологическую  БЗ  необходимо  графически  отобразить  с  помощью  семантических 



гиперграфов,  это  возможно  сделать  с  помощью  плагина  OntoGraf,  который  позволяет 

посмотреть  иерархию  классов,  свойства  и  отношения.  Рассмотрим  графический  класс 

«свойства операций»  

 


«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



92 

 

 



 

Рисунок 5 – Онтограф 

 

Разработанные  база  знаний  и  тезаурус  предназначены  для  использования  при 



создании интеллектуальных обучающих и контролирующих систем. 

 

Список использованной литературы: 

 

 1. Оскерко В.С., Пунчик З.В. Моделирование базы знаний на основе онтологии. Статья. 2005, 

1-2 с.  


2. https://ru.wikipedia.org/wiki 

3.  Наталья  Ф.  Ной  (Natalya  F.  Noy)    и  Дэбора  Л.  МакГиннесс.  Разработка  онтологий  101: 

руководство по созданию Вашей первой онтологии 

 

posts/pochemu-luchshe-ispolzovat-python-v-kachestve-pervogo-yazyika-



 

УДК 681.5 



КОЧКОНБАЕВА Б. О. 

 

АЛГОРИТМ СИНТАКСИЧЕСКОГО АНАЛИЗАТОРА ДЛЯ МАШИННОГО 

ПЕРЕВОДА ТЕКСТОВ 

 

(Ошский технологический университет, Ош, Кыргызстан) 

 

Исследования  в  области  искусственного  интеллекта  набирают  все  новые  этапы 

развития.  Особенно  в направлении машинного  перевода.  Сегодня  компьютер  может  связно 

переводить  текст  с  одного  языка  на  другой.  В  этой  статье  рассматриваются  вопросы  в 

области  машинного  переводатекстов  с  русского  языка  на  кыргызский  язык.  Вообще,  что 

такое машинный перевод? 

Машинный  перевод  –  процесс  перевода  текстов  с  одного  естественного  языка  на 

другой  с  помощью  специальной  компьютерной  программы  [1].  При  создании  программы 

машинного перевода компьютер должен осуществить графометическую, морфологическую, 

синтаксическую и семантическую обработку текста.  

В  графометическом  анализе  входной  текст  разбивается  на отдельные  словоформы,  и 

программа запоминает расположение словоформ в тексте.  

Целью 

морфологического 



анализа 

является 

определение 

всех 


вариантов 

грамматических  характеристик  (для  кыргызского  языка  это  часть  речи,  число,  падеж;  для 

русского языка часть речи, число, род, падеж) к каждой словоформе входного текста. 


«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



93 

 

Синтаксический  анализатор  определяет  наличие  и  характер  синтаксических  связей 



между  словоформами,  создает  синтаксическую  структуру  текста.  А  семантический 

анализатор создает структуру входного текста [2]. 



Особенности кыргызского языка 

Кыргызский язык относится к группе агглютинативных языков т.е. слова образуются 

с  прибавлением  аффиксов  к основе  слова.  Изучая  строение  слов  кыргызского  языка  можно 

выделить следующие особенности: 

1.  В кыргызском языке аффиксы добавляются по закону сингармонизма.  

2.  В  отличие  от  русского  языка,  существительные  в  кыргызском  языке  не  имеют 

категории  рода,  поэтому  нет  согласования  между  существительным  и  прилагательным, 

существительным и числительным. При склонении сочетаний из этих частей речи падежные 

окончания прибавляются к существительным.  

3.  Роль  русских  предлогов  и  приставок  в  кыргызском  языке  выполняют  аффиксы  и 

служебные  слова:  направо-  оң  жакка,  приехал-келди,  до  свидания-жолугушууга  чейин,  для 

меня-мен үчүн. 

4.  В кыргызском языке много слов омонимов. Например, слово “жаз” используется как 

существительное, в значении времени года (весна) и в значении глагола (пиши).  

5.  В  строении  предложений  кыргызский  язык  относится  к  группе  SubjectObjectVerb 

(SOV). В предложении есть состав существительного и состав глагола. 

Если  учесть  эти  особенности  языка,  можно  добиться  неплохого  результата  в 

автоматической обработке текстов кыргызского языка. 



Программная реализация морфологического анализатора 

Имеются 


немало 

методов 


морфологического 

анализа 


использующихся 

в 

лингвистических  процессорах.  Можно  выделить  методы  с  декларативной  и  с  процедурной 



ориентацией. 

Для  методов  декларативной  ориентации  характерно  наличие  полного  словаря  всех 

возможных словоформ для каждого слова. При этом каждая словоформа снабжается полной 

морфологической  информацией.  В  методах  с  процедурной  ориентацией  каждое  слово 

разделяется на основу и аффикс, и словарь содержит только основы слов вместе со ссылками 

на соответствующие строки в таблице возможных аффиксов.    

 

Так,  как  русский  язык  очень  сложный  язык,  при  составлении  алгоритма 



программы машинного перевода я использовала эти оба метода.  

 

Следующий фрагмент программы разделяет входное предложение на лексемы. 



Здесь как видно знаки вводятся как конечное множество символов. 

d:=[' ','.','?','!',':','(',')',',']; 

i:=0;s[1]:='';t:=1; 

repeat 


readln(s1);l:=length(s1); 

for k:=1 to l do 

if s1[k] in d then 

begin 


if s[t]<>'' then t:=t+1;s[t]:=''; 

end 


else 

s[t]:=s[t]+s1[k];i:=i+1; 

until i>l; 

 

После  разбиения  текста  на  предложения  и  слова  идет  этап  морфологического 



анализатора. Для этого составлена база данных слов.  

 


«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



94 

 

 



Рисунок 1 - База данных «Падежи» 

 

Такие базы составлены для таких грамматических атрибутов как часть речи, число, 



род, лицо и время. Связь с этими данными осуществляется в таблице слов. 

 

 



Рисунок 2 - Таблица слов русского языка 

 

Как видно база включает всю информацию о словоформах. В таком случае задача 



морфологического анализа сводится к поиску нужной словоформы в словаре и копированию 

морфологической информации: 

s_w.rus[i+1]:=trim(adoquery1.fieldbyname('word_r').Text); 

s_w.kur[i+1]:=trim(adoquery1.fieldbyname('word_k').Text); 

s_w.rod[i+1]:=strtoint(adoquery1.fieldbyname('id_rod').Text); 

s_w.pad[i+1]:=strtoint(adoquery1.fieldbyname('id_padej').Text); 

s_w.ch_r[i+1]:=strtoint(adoquery1.fieldbyname('ch_r').Text); 

Программная реализация синтаксического анализатора 

Входными  данными  для  синтаксического  анализатора  являются  предложения.  Я  в 

программе текст выделяла на массив слов и предложений. Следующий фрагмент программы 

показывает, как получила массив слов из входного текста.  

for k:=1 to l do 

if s1[k] in d1 then 

begin 

                  t1:=t1+1; 



znaki[t1]:=s1[k]; 

end 


else 

words[t1]:=words[t1]+s1[k];     

Далее  берем  отдельные  предложения.  Каждое  предложение  считывается  пословно, 

после  чего  словоформа  поступает  в  морфологический  анализатор.  В  результате 

определяются  всевозможные  основы  и  соответствующие  грамматические  показатели.  В 

зависимости  от  части  речи  и  грамматических  показателей  выделяются  соответствующая 

синтаксическая  группа.  После  предварительной  обработки  словоформа  поступает  в  блок 

генерирования  гипотез.  На  его  вход  поступает  словоформа.  Если  это  первое  слово  в 

предложении, то в соответствии с частью речи определяется синтаксическая группа.  

В  зависимости  от  частей  речи  группа  может  определяться  однозначно,  либо  могут 

быть варианты. Например, если на вход  поступило имя существительное, то первая группа в 

предложении  будет  именной.  В  этом  случае  запоминается  порядковый  номер  группы  и 

обрабатывается  следующее  слово.  Если  первым  словом  является  наречие,  то  оно  может 

относиться  как  к  глагольной  группе,  так  и  к  группе  прилагательного.  В  этом  случае  для 



«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



95 

 

однозначного определения группы  требуется  следующее  слово.  Таким образом,  выделяется 



группа подлежащего и группа сказуемого[3].  

В  программе  для  визуального  просмотра  работы  синтаксического  анализатора  я 

использовала объект TreeView (рис.3).  

 

Рисунок 3 - Использование TreeView 



 

Для  машинного  перевода  текстов  с  русского  языка  на  кыргызский  язык  я 

использовала обратный  порядок  слов.  Например,  в предыдущем  примере  порядок  перевода 

будет как SOV (Мен футбол ойноп жатам.). 



Заключение 

В  результате  описанных  в  настоящей  статье  разработок  был  создан  модуль 

морфологического и синтаксического анализатора текста русского языка.  

Морфологический  анализатор  разбивает  текст  на  лексемы  и  на  предложения. 

Синтаксический  анализатор  позволяет  производить  разбор  предложения.  Данная  работа 

является  первым шагом  в  создании  машинного перевода,  и  в  дальнейшем  я  буду  развивать 

семантический анализатор.   

 

Список использованной литературы: 

 

1.  Ж.Ч.  Джанузакова  «Лингвокультурологические  аспекты  машинного  перевода»  [электронный 



источник]. 

2. К.Х. Ким, А.П. Савинов «Синтаксический анализатор для вопросно-ответной системы» 

3.  А.  Леонтьева,  И.  Кагиров  «Автоматический  синтаксический  анализ  русских  текстов».  Труды 

10-й  Всероссийской  библиотеки:  перспективные  методы  и  технологии,  электронные  коллекции»-

RCDL’2008,Дубна, Россия,2008. 

 

 



ӘОЖ 004.912:811.512.122 

 

ҚАЙУПОВ Е.К., БАЙБОЛАТ Н., КАМАНУР У., ЗҰЛҚАЖАП А. 

 

ҚАЗАҚ ТІЛІНЕ ГРАФЕМАТИКАЛЫҚ ТАЛДАУ ЖАСАУ 

 

(НИИ «Искусственный интеллект» Л.Н. Гумилев атындағы ЕҰУ, ақпараттық 

технологиялар факультеті, Астана, Қазақстан) 

 

Кіріспе 

Қазіргі танда халықаралық қатынастарды жақсарту мақсатында , әлем халықтары бір 

бірін түсініп білу үшін табиғи тілді формалдап, бір тілден екінші тілге аударма жасау тікелей 

ғана  (сөзбе  сөз)  аудармай  ,  мағыналы  түрде  аудару  қолға  алынып  зерттеліп  жатыр.  Кез 

келген  мәтінді  автоматты  түрде  өңдеу  кеңінен  зерттелуде.  Осылай  қарқынды  түрде  дамуы 

есептеуіш  техникалардың  қуатылығы  артып  үлкен  көлемді  мәліметтері  бар  күрделі 

лингвистикалық  алгоритмдерді  өңдейтін  мүмкіндік  туғызды.  Есептеуіш  техника  қанша 


«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



96 

 

дамығанмен  табиғи  тілді  формалдау  мен  мәтінді  автоматты  түрде  өңдеу  үшін  әр  түрлі 



бағыттағы  көптеген  адамдар  қажет  және  де  лингвистиканың  деректер  қоры  өте  үлкен. 

Мәтінді  автоматты  түрде  өңдейтін  көптеген  программалар  бар,  олардың  бірнешеуін  айтып 

өтсек:  AskNet,  Russian  Context  Optimizer,  Ontos,  Google  Mini,  Google  Desktop,  Арион  және 

т.б.  Айтқанымыздай  мұндай  программалар  көп,  тек  қазақ  тілінде  жұмыс  істейтін 

программалардың  дамуы  қарқыны  сын  көтермейді  және  тиімділігі  деңгейі  көңіл 

кқншітпейді. Негізінен ағылшынша, орысша, қытайша тілдегі лингвистикалық программалар 

жақсы  дамыған.  Сондықтан  ақпараттық  салада  қазақ  тілін  дамыту  мақсатында,  әрі  басқа 

халықтармен қарым-қатынас саласын жеңілдету үшін лингвистикалық зерттеулер жүргізіліп, 

қазақ тілді мәтіндерді талдау алгоритмдері жасалып, программалық түрде жүзеге асырылуда. 

Енді осы алгоритмдердің бастапқы қадамы графематикалық талдауға тоқталсақ. 



Жалпы бөлім 

Графематикалық талдау  –  бұл символдар тізбегінен тұратын табиғи тілді талдайтын 

ұғым.  Графематикалық  талдау  жасалғаннан  кейін  ғана  Морфологиялық  және  Синтаксистік 

талдау жасауға болады (1-сурет) 

 

1- сурет. Табиғи тілді талдау алгоритмдерінің орындалу кезеңдері 



 

Графематикалық талдаудың міндеттеріне мыналар кіреді : 

1. Кірген мәтінді графемдерге  бөлу (сөздерге, сөз тіркестеріне); 

2. Сөйлемдер шекарасын анықтау; 

3. Сөздер мен қызметтік графемдерді ажырату (мысалы тыныс белгілері) 

4. Сөздер регистрін анықтау; 

5. Жалқы атауларды анықтау;  

6. Қысқартылған сөздерді анықтау 

7.  Стандарт  емес  элементтерді  бөліп  көрсету  және  белгілеу  (лексикалық  емес), 

мысалы:  

- Форматтау элементтері –  курсивтілігі, сызықтығы; 

- Абзацтарды, тақырыптар, ескертпелерді бөліп көрсету; 

-  Мәтін  ішінен  сөз  емес  элементтерді  көрсету  (Сандар,  цифр  түрінде  берілген  күн, 

әріп пен цифр араласқан кешен, және т.б.);  

- АЖТ (Аты, жөні, тегі), бөліп көрсетеді, егер аты мен тегі қысқа түрінде болса; 

- Кесте және кесте атын көрсету 

- Сурет және сурет атын, форматын көрсету 

- Латынша жазылған шетелдік сөздер және  т.б. 

Талдауда қиындық туғызатын сөздер:  қос сөздер, қысқарған сөздер және т.б; 


«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



97 

 

Жоғарыда айтылған міндерттерді орындау үшін  тілдер теориясына иек арта отырып 



біз графематикалық талдаудың формалды  әдісін жасап, программалық орындалуын жүзеге 

асырдық. Программа бөлігінің коды 2 суретте көрсетілген. 

 

 

 



2-сурет. Қазақ тіліндегі мәтінге графематикалық талдау жасау программасынан үзінді. 

 

Қорытынды 

Графематикалық  талдау  лингвистикада  өте  маңызды  рөл  атқаратынын  көрдіңіздер. 

Бұл талдаусыз морфологиялық, синтакситік, семантикалдық талдау жасау мүмкін емес. Осы 

талдаудың барлық шарттары программада ескерілсе ғана , біздің басқа талдауларымыз дұрыс 

шығады. Егер де жоғарыда айтылған шарттардың кем дегенде біреуі ескерілмей қалса, онда 

программа  жұмысында  көптеген  қателіктер  туындайды.  Осы  талдау  дұрыс  орындалуына 

байланысты  көптеген  программалар  мен  қосымшалар  тиімді  және  оптималды  жұмыс 

жасайды.  Ол  бір  тілден  екінші  тілге  аударғанда  мағыналы  аударылуына,  интернетте  сұрату 

жасағанда немесе керек мәліметті іздегенде дұрыс және нәтижелі болуын қамтамасыз етеді. 

Жоғарыда  айтып  өткен  программалардың  барлығында  графематикалық  талдау  жасалынып, 

соның  нәтижесінде  көптеген  істер  орындалуда.  Графематикалық  талдау  програмада  толық 

жазылды және жақсы нәтиже көрсетті, жалпы жұмыс орындалды. 

 

Қолданылған әдебиеттер мен сілтемелер: 

 

1.  Шәріпбаев  А.А.,  Тұрғанбекова  //  Қазақ  тілі  төл  дыбыстары  негізіндегі  жалғаулар 



ережелерін формалдау // Л.Н.Гумилев атындағы ЕҰУ Хабаршысы, Астана, 2002. 

2. Қазақ тілі / Қанат Егенбердиев, Қанат Ибрагимов. - Алматы: Астана-кітап, 2013. - 234 бет. 

3. Уталина Б.Ш., Шәріпбаев А.Ә. Қазақ тіліндегі сөйлемдерді танудың математикалық әдісі. // 

Международная  научно-практическая  конференция.  «Информационно-инновационные  технологии: 

Интеграция  науки,  образования  и  бизнеса»,  посвященной  75-летию  КазНТУ  им.  К.И.  Сатпаева.  – 

Алматы, 2008. – С. 221-225. 

4. Бекманова Г.Т. «Қазақ тілінің сөздерін танудың әдістері мен алгоритмдері». – Астана, 2010. 

5.  Қазақ  грамматикасы.  Фонетика,  сөзжасам,  морфология,  синтаксис.  –  Астана,  2002.  –  784 

бет. 

6.  Уталина  Б.Ш.,  Шәріпбаев  А.Ә.,  Қазақ  тіліндегі  сөз  тіркестерін    талдау  ережелерін 



автоматтандыру. // Л.Н.Гумилев атындағы ЕҰУ Хабаршысы.- 2005. - №6 .-Б 38-40. 

«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



98 

 

7.  Шәріпбаев  А.Ә.,  Мамыр  улы  Т.  Қазақ  тілінің  грамматикасын  формальды  сипаттау. 



//Қазақстан  Республикасы  Ұлттық  Ғылым  Академиясының  Информатика  және  басқару 

институтының еңбектер жинағы. Ғылым, -Алматы, 1996. –Б. 194-197. 

8.  Уталина  Б.Ш.,  Шәріпбаев  А.Ә.  Қазақ  тілінің  сөз  тіркестерін  талдау  ережелерін 

автоматтандыру. //Информатизация общества: материалы 1-ой Международной научно-практической 

конференции.- Астана: ЕНУ им. Л.Н.Гумилева, 2004. - С.178-179. 

9. Кулагина О.С. Исследования по машинному переводу. — М.: Наука, 1979. — 127 с. 

10. http://www.asknet.ru/analytics/programms.htm 

 

ӘОЖ 517.9 



 

МАМЫРБАЕВ Ө.Ж., ИБРАИМКУЛОВ А.Е., НУРЛАН К.Е. 

 

БИОМЕТРИЯЛЫҚ ӘДІС АРҚЫЛЫ ТҰЛҒАНЫҢ ДАУЫСЫН СӘЙКЕСТЕНДІРУ 

МЕН ТАНУ ЖОЛДАРЫ 

 

(ҚР БҒМ Ақпараттық және есептеуіш технологиялар институты, Алматы қ.) 

 

Кіріспе.  Қазіргі  уақыттағы  ғылыми–техникалық  прогресстің  дамуына  жаңадан 

құрылған техникалар мен технологияларды жетілдіру, ғаламдық ақпараттық үдеріске ілесуге 

жол  ашу  және  сәйкесінше  оның  қауіпсіздік  саласын  қамтамасыз  етуді  жатқызамыз. 

Ақпараттық  қауіпсіздікті  қамтамасыз  ету  жолындағы  биометриялық  әдістер,  алгоритмдер 

мен  технологиялардың  саны  артуымен  байланысты  биометриялық  сәйкестендіруге  ғылыми 

және  тәжірибелік  тұрғыда  қызығушылық  артуда.  Биометрия  жеке  тұлғаны  физиологиялық 

және мінез - құлық сипаттары бойынша тану әдісі[1].  Биометриялық тану әдісі арқылы: 

Белгісіз  адамды  қайталанбас  белгілері  бойынша  сәйкестендіруге  болады.  Көбіне  бұл 

жағдай  криминалистикада  қолданылады  (тұлғаны  суреті  бойынша  сәйкестендіру,  қолының 

таңбалары арқылы, ДНҚ сараптамалары арқылы және т.б.) 

Тұлғаны  мәліметтер  қорында  орналасқан  өзіне  тән  белгілері  арқылы  тексеру 

мақсатында қолдануға болады (жеке куәлігі, паспорты және т.б.) 

Биометрияны  қолдану  аумағына  келесі  сала  қызметтерін  жатқызамыз:  құқық  қорғау 

саласы, қаржы қызметі (банк, банкомат), мемлекеттік тіркеу органы (биометриялық паспорт), 

электронды  сауда,  кәсіпорын,  қонақ  үйлер,  әуежай,  мектептер,  сауда  орталықтары.  Көбіне, 

биометриялық  технологиялар  қылмысты,  қолжетімділікті  бақылау  мен  азаматтарды 

сәйкестендіруді тану мақсатында қолданылады. 

Биометриялық сәйкестендіру қасиетіне төмендегілер жатады: 

-  Саусақтарының із таңбалары; 

-  Бетпішінінің геометриясы; 

-  Көздің сыртқы мөлдір қабығы; 

-  Көздің ішкі тор қабығы; 

-  Дауыс; 

-  Жазу мәнері; 

-  Пернетақтада жазу; 

-  Қолдағы көк тамыр сызықтары[2]; 

Тұлғаны  дауысы  арқылы  сәйкестендіру  мен    танудың  маңыздылығы.  Дауыс  арқылы 

сәйкестендірудің  биометриялық  әдісін  қолдану  ыңғайлы  болып  саналады.  Оның  себебі 

ретінде  компьютерге  микрофондарды  енгізу  мен  телефон  желілерінің  көптеп  таралуында. 

Кемшілік ретінде бірнеше факторларды сипаттап өте кетсек, тануға кері әсерін тигізетіндер: 

микрофондағы кедергілер, шудың естілуі, айтылу жағдайындағы қателіктер, сонымен қатар, 

сәйкестендіру процессіндегі адамдардың әртүрлі эмоционалды жағдайы және т.б. әсер етеді. 



«ҚОҒАМДЫ АҚПАРАТТАНДЫРУ»  V ХАЛЫҚАРАЛЫҚ ҒЫЛЫМИ-ПРАКТИКАЛЫҚ КОНФЕРЕНЦИЯ 

 

 



99 

 

Дауыс  арқылы  сәйкестендіру  құрылғысын  құрудың  ең  бастысы  –  дауыстың  өзіндік 



қасиетін  сипаттайтын  параметрлерді  таңдау.  Осы  сигналдың  параметрі  өзгеше  белгі  деп 

аталады. Осындай белгілер, дауыстың ерекшелігенде өзге қасиеттерден тұруы тиіс.  

Бүгінгі  таңдағы  сөйлеуді  автоматты  тану  жүйелері  соңғы  ондаған  жылдарда  үлкен 

қарқынмен  алға  қадам  басты.  Олардың  ішінде  қарапайым  дикторға  тәуелді  қосымшалардан 

бастап  жаңалықтарды,  телефонмен  сөйлесулерді,  дәрістерді  т.б.  автоматты  мәтінге 

айналдыратын дикторға тәуелсіз жүйелер бар. 

Заманауи  сөйлеуді  тану  әдістері  мен  алгоритмдері  Nuance  ұсынған  Dragon 

NaturallySpeaking,  IBM  ұсынған  ViaVoice,  Microsoft  ұсынған  Windows  Speech  Recognition, 

Google  ұсынған  Google  Voice  Search  коммерциялық  өнімдерінде  кеңінен  қолданыс  тапқан. 

Жапонияда  Docomo  телекоммуникациялық  компаниясы  жапон,  ағылшын  және  қытай 

тілдерінің дауыстық аудармашы сервисін іске қосты, оның негізі аталған тілдердегі сөйлеуді 

тану жүйелері болып табылады[3].  

Сөйлеу  сигналдарын  өңдеу.    Сөйлеулерді  тану  технологиясын  өңдеуді  ғалымдар 

сөйлеу сигналын суреттейтін, ақпараттық белгілерді  бөлу әдісін меңгеруден бастады. Кейін 

сөйлеу  сигналдарының  классификациясының  ақпараттық  белгілер  жиынтығының  есебін 

шешуге кірісті [4]. 

Сөйлеу сигналын суреттейтін, ақпараттық белгілерді бөлудің келесідей әдістері бар: 

-  сызықтық болжау әдісі;  

-  спектрлік талдау әдісі;  

Спектрлік талдау әдісі сызықтық болжау әдісінен орташаланған шудың орташа мәндік 

бағасы мәліметтер бойынша есептелген, спектрден алынатындығымен ерекшеленеді. 

Классификацияда және тануда ең жиі қолданылатын екі тәсіл: 

-  жақын параметрлерінің өлшемі (бұндай функция метрика деп аталады);  

-  нейрондық желілер; 

Екінші  әдіс  көмекші  функцияларды  қолданбайды,  бірақ  биологиялық  жүйедегі  тану 

процесін модельдейді. Қарастырылып отырған әдіс қазіргі уақытта қолданысқа ие. 

Сөйлеулерді тану жүйесінде екі басты қосалқы жүйе ерекшеленеді: 

-  алдан - ала сөйлеу сигналын өңдеудегі қосалқы жүйе; 

-  сөйлеу сигналының классификациясының қосалқы жүйесі; 

1 – суретте алдан - ала сөйлеу сигналын өңдеу схемасы көрсетілген. 

 

 

 



 

 

 



 

 

 



1-сурет. Жасанды нейрондық желіге негізделген сөйлеулерді тану моделі 

 

Сөйлеулерді  автоматты  тану  кезінде  (MFCC)  мел  –  жүйелік  кепстральды  немесе 



(PASTA  –  PLP)  спектрлі  перцепционды  өзгертулерге  қатысты  сызықтық  болжаулар  және 

векторлық  белгісі  ретінде(GMM)  –  HMM  гаусстық  моделі  [5]  және  сонымен  бірге 

акустикалық модель колданылды. 

Тұлғаны дауысы арқылы сәйкестендіру жүйесін 2- суреттегідей ұсынуға болады.  

Сөйлеу 

сигналын енгізу 



Берілген сигналдан 

сөйлеуді бөліп алу 

Алдынv-ала сүзу

 

Кадрдағы 



сигналдарды бөлу 

Аралықтағы 

сингалдарды өңдеу

 

Спектральдыкөр



нісі

 



Достарыңызбен бөлісу:
1   ...   10   11   12   13   14   15   16   17   ...   57




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет