Атты І халықаралық конференция ЕҢбектері


С. Ж.КАРАБАЕВА, А.И.ИМАНАЛИЕВА



Pdf көрінісі
бет193/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   189   190   191   192   193   194   195   196   ...   326
С. Ж.КАРАБАЕВА, А.И.ИМАНАЛИЕВА  
 
 
Кыргызский государственный университет строительства, транспорта и архитектуры 
им. Н.Исанова, Бишкек, Кыргызстан 
 
 
ИСПОЛЬЗОВАНИЕ ГРАММАТИЧЕСКИХ ПРАВИЛ В ПРОЛОГе 
(на примере кыргызского языка) 
 
This article describes the three stages of technology, parsing sentences in the Kyrgyz language. 
The first stage provides the basic definitions and concepts that allowto record a formal language, as 

certain 
mathematical 
object. 
In 
the 
second 
stage  we  create  a  model  with  details  of  the  list  word,  with  each  link  and  their 
dependence  relations.  In  the  third  stage  we  construct  a  two-stage  level  of  words  in  the  Kyrgyz 
language. 
Настоящая статья описывает три этапа техники разбора предложений кыргызского языка. 
На  первом  этапе  даются  основные  определения  и  понятия,  позволяющие  записать 
формальный 
язык 
как 
некоторый 
математический 
объект. 
Навтором 
этапе  мы  создаем  модель  с  детали  головы  списка,  каждое  звено  и  их 
зависимость  отношений.На  третьем  этапе  построим  двухступенчатый  уровень  слов 
кыргызского языка. 
Ключевые  слова:  формальный  язык,  формальные  модели  языка,  список,  цепочка, 
синтаксис, семантика. 
Известный  кыргызский  ученый  Касым  Тыныстанов  в  своих  научных  исследованиях 
поставил задачу создать список всех кыргызских слов.  
Но,  как  известно  из  психологических  исследований,  если  даже  очень  умный  человек 
попытается вспомнить информацию одного типа, то одна информация повторится, а другая 
может забыться. 
Поэтому, Касым Тыныстанов  составил из нескольких вертикальных таблиц кыргызский 
алфавит (на основе латыни), он выписывал слова, которые получались путем сдвига таблиц

Конечно,  чтобы  ускорить  подбор  К.  Тыныстанов  применил  некоторые  грамматические 
особенности.
 
Ему удалось создать остроумный алгоритм, использовав, который он придумал простое и 
оригинальное  техническое  средство,  названное  «технической  таблицей».  С  помощью  этого 
средства за короткий промежуток времени, Касым Тыныстанов собрал богатый лексический 
запас кыргызского языка, содержащий около ста тысяч слов. 
Известный профессор-полиглот Е. Д. Поливанов в отзыве о научной деятельности Касыма 
Тыныстанова  в  1935  г.  писал  «…1)  начав  с  задания  лексикологического  характера, 
К.Тыныстанов  самостоятельно  изобрел  оригинальный  способ  (и  технический  прибор)  для 
исчерпывающего  обследования  словарного  запаса  в  индивидуальном  языковом  мышлении 
(изобретение это может иметь большое теоретическое и прикладное значение); 2) работа над 
словарем привела К. Тыныстанова к вопросам так называемой морфонологии…» . 
В  первой  половине  ХХ  века  из  идей  и  трудов  таких  мыслителей  появилась  нынешняя 
наука информатика. 
I.  Рассмотрим основные понятия теории формальных языков. 
Язык  (искусственный  и  естественный)  состоит  из  трех  основных  компонентов:  словаря, 
синтаксиса и семантики. 
Формальные  языки,  так  же  как  и  языки  естественные,  можно  рассматривать  с  точки 
зрения  их  формы,  структуры,  иначе  говоря,  синтаксиса,  и  с  точки  зрения  смысла, 
вкладываемого  в  приложения  языка,  т.е.  семантики.  Синтаксический  анализ  формальных 
языков во многом напоминает известный по школе грамматический разбор предложений. 


183 
 
Словарь языка содержит множество лексем. 
Словарь – это конечное множество элементов, называемых символами. 
Пусть задан словарь V. 
Цепочка над словарем V- это произвольная упорядоченная последовательность символов 
словаря. Например, V={a, b, c} – это словарь. a=aabc – цепочка, β – bbaaca – другая цепочка.   
Пустая цепочка – это цепочка, не содержащая символов ( . 
Пусть  V–  некоторый  словарь.  V
*
-множество  всех  возможных  цепочек,  составленных  из 
символов словаря V, включая пустую цепочку . 
Необходимой  составляющей  описания  любого  языка  является  его  алфавит,  т.е.  непустое 
конечное  множество  элементов  (символов),  из  которых  состоят  предложения  языка.  Будем 
обозначать алфавит следующим образом: 
А=

Всякая  конечная  последовательность  символов  алфавита  называется  цепочкой  (строкой 
или списки). Допускается существование пустой цепочки (или списки).  
Длина 
цепочки 
записывается 
как
.  Таким  образом, 
если  ABC,  AABB,  []  есть  цепочки,  то 
  =  3, 
=4,  []=0.  В  заглавные  буквы 
обозначают символы языка, а строчные – цепочки символов, т.е.  
 
Конкатенацией (сцеплением) цепочек и  называется цепочка Z, состоящая из цепочки х 
и  дописанной  в  след  цепочкой  у.  Конкатенация  цепочек  х  и  у  обозначается  как  ху.  Если 
х=АВС, y=DEF, то xy=ABCDEF. Если z=xy, то z=ху, то х-голова, а у –хвост цепочки (списка) 
z. Будем обозначать множество цепочек через 
и т.д. Произведением  
 двух множеств 
цепочек  
 является множество, состоящее из всех комбинацией цепочек  
 
=
 
Если 
 то  
 =
 


Достарыңызбен бөлісу:
1   ...   189   190   191   192   193   194   195   196   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет