Атты І халықаралық конференция ЕҢбектері

жүктеу/скачать 8,57 Mb.

Pdf көрінісі

бет	21/39
Дата	25.12.2016
өлшемі	8,57 Mb.
	#403

1 ... 17 18 19 20 21 22 23 24 ... 39

С. Ж.КАРАБАЕВА, А.И.ИМАНАЛИЕВА

2.

Темпоральные категории
По темпоральному признаку глаголы в тюркских языках выражают значения прошедшего,
настоящего и будущего времени, но каждая форма обычно совмещает несколько значений,
что  ставит  вопрос  о  том,  какие  семы  выделять  в  качестве  основных,  доминирующих  и
фиксировать в названиях категорий.
2.1. Прошедшее время
Форма прошедшего времени на -ДЫ в разных работах по грамматике называется:
- прошедшее определенное,
- прошедшее категорическое [9],
- прошедшее очевидное.
Существующая  многозначность  глагольных  форм  приводит  к  тому,  что  в  тюркских
грамматиках часто предпочтительными оказываются формулировки типа «прошедшее время
на  -ды»,  «причастие  на  -ып»,  «имя  действия  на  -у»  и  т. п.  Такая  терминология  для  нашей
системы  неприемлема  с  учетом  того,  что  морфологический  анализатор  уже  выделяет
соответствующие аффиксы, и дублировать их в названиях категорий нет никакого смысла.
Если  эмпирические  факты  свидетельствуют  о  том,  что  грамматические  значения
существуют  лишь  в  «связанном»  виде,  то  возникает  вопрос:  что  именно  фиксировать  в
системе  обозначений?  При  семантическом  подходе  возможно  выявление  элементарных
значений  –  «семантических атомов»

путем межъязыкового сопоставления. Однако в  нашей
системе  обозначений  отправными  точками  классификации  являются  аффиксы,  которые
объединяют  комплексы значений (темпоральность + модальность), при этом интерпретация
зависит от контекста.
Например,  в  работе  [15]  указывается,  что  парадигматическим  значением  прошедшего
категорического  времени  в  татарском  языке  является  «выражение  очевидного,  целостного,
однократного  действия  в  прошлом».  Однако  добавление  эта  однократность  пропадает  при
добавлении в словоформу морфемы –ГАлА или –[Ы]штЫр.
Например:
барды ‘ходил’ – баргылады ‘хаживал’ – барыштырды ‘хаживал’.
При этом в различных контекстах может идти речь о временной локализации действия, о
динамике развертывания действия, законченности/незаконченности действия, длительности,
повторяемости действия и т.д.
Прошедшее  категорическое  как  в  татарском,  так  и  во  многих  тюркских  языках  обычно
противопоставлено  прошедшему  результативному  или  результативным,  поскольку  в
казахском языке есть еще две формы прошедшего, выражаемых с помощью морфемы –ҒАн
и  -[Ы]п.  Прошедшее  категорическое  и  результативное  противопоставляются    не  по
аспектуальным  параметрам,  а  по  вовлеченности  субъекта  высказывания.  Оно  выражает
действие очевидное, несомненное, свидетелем которого являлся сам  субъект (субъективная
модальность), когда субъект сам являлся свидетелем действия и осознает это.

Например:

178

яңгыр яуды ‘шел дождь’ - субъект видел, как он шел.
При  прошедшем  некатегорическом  субъект  может  наблюдать  результат  действия  в
прошлом, но не само действие
яңгыр  яуган  ‘шел  дождь’  -  субъект  видел  не  сам  дождь,  а  может  наблюдать  лужи  и
мокрую землю или о дожде сообщает другое лицо. Русский перевод не отражает специфику
противопоставленных  форм.  В  татарском  языкознании  не  выделяется  специализированная
грамматическая  категория  эвиденциальность,  но  значение  очевидности  присутствует  в
связанном  виде  со  значением  прошедшего  времени  и  является  отличительным  признаком
прошедшего категорического времени.
Отсюда прошедшее категорическое время можно было бы маркировать и как PST_EVID
(прошедшее  эвиденциальное)  -  формально  это  выглядит  как  нечто  непривычное,  но  такая
помета  вполне  укладывается  в  русло  тех    тюркских  грамматик,  которые  прошедшее
категорическое называют «прошедшим очевидным» или «прошедшим определенным».
В  своей  системе  обозначений  мы  выбрали  вариант  PST_DEF(«прошедшее
определенное»).
2.2.

Будущее время
Синтетические  формы  будущего  времени  в  работах  по  татарской  грамматике  наиболее
часто называются: будущее неопределенное и будущее категорическое.
Будущее  неопределенное  –  выражается  с  помощью  морфемы  –[Ы]р:  -ыр/-ер/р/-с.  В
казахской  грамматике  оно  называется  –  будущим  предположительным  временем  [9].  А  в
турецком  языке  с  помощью  морфемы  -[I]r  выражается  настоящее-будущее  время,  которое
кроме  значения  неопределенности  в  совершения  действия  еще  означает  и  регулярно
повторяющееся действие.
Будущее категорическое время – в татарском языке выражается с помощью аффиксальной
морфемы  –АчАк:  -ачак/-әчәк/-ячак/-ячәк.  В  грамматике  турецкого  языка  оно  также
называется  будущим  категорическим  временем,  а  в  казахском  языке  такая  категория
отсутствует [9].
Дифференциация
этих
форм
связана
с
модальными
значениями
определенности/неопределенности и категоричности/некатегоричности.
Наличие  осложнения  темпорального  значения  модальными  делает  возможными
конкретизирующие  тэги,  указывающие  на  это:  FUT_PROB  (Probabilitive)  или  FUT_POTEN
(Potentialis).
В  базе  данных  Verbum  термин    Probabilitive   используется  для  обозначения  форм,  когда
говорящий  оценивает  ситуацию  P  как  вероятную  -  как  правило,  в  будущем  ("возможно",
"вероятно",  "скорее  всего"),  при  этом  степень  уверенности  говорящего  специально  не
различается: от "может быть" до "скорее всего" (Verbum). Конкретизирующий тэг potentialis
также указывает на возможность совершения действия.
Предложенная нами, система грамматической разметки для глагольных времен татарского
языка включает следующие тэги:

Таблица 1. Темпоральные категории
Обозначение
Наименование
Морфемы
PRES
настоящее время
-Й: -й/-a/-ә
PST_DEF
прошедшее категорическое
-ДЫ: -ды/-де/-ты/-те
PST_INDF
прошедшее результативное (перфект)
-ГАн: -ган/-гән/-кан/-кән
FUT_DEF
будущее категорическое
-АчАК: -ачак/-әчәк/-ячак/-ячәк
FUT_INDF
будущее неопределенное
-[Ы]Р: -ар/-әр/-ыр/-ер/-р/-с
Для  использования  этих  обозначений  для  других  тюркских  языков  требуется  некоторая

179

доработка.

3.

Залоговые категории
Залоговые формы  в тюркских языках также являются полисемантичными и практически
полностью совпадают во всех трех перечисленных тюркских языках.
В  татарских  грамматиках  для  взаимно-совместного  залога,  выражаемого  морфемой  –
[Ы]ш:  -ыш/-еш/-ш  выделяют  3  основных  значения,  которые  могут  быть  обозначены  при
помощи терминов, используемых в современных работах по типологии:
1. Взаимное значение (реципрок) — «действие представляется  не только  исходящим от
его производителя, но и направленным на него со стороны другого лица» [15]. В этом случае
субъект ситуации одновременно является ее объектом.
2. Значение содействия — действие осуществляется в помощь другому лицу, Обычно это
глаголы  деятельности,  а  синтаксическая  конструкция  включает  адресата  в  форме
направительного  падежа.  В  базе  данных  Verbum  для  значения  содействия  используется
термин  Assistive, однако он там обозначает подтип каузативной актантной деривации, когда
«субъект каузирует ситуацию P, помогая ее осуществлению ("помогать", "способствовать")»
[13].
3. Значение совместности действия  - совместность осуществляемых действий (обычно в
этом значении функционируют непереходные глаголы.).  У  В. Плунгяна это тип актантной
деривации  Associative,  когда  субъект  участвует  в  ситуации  P  совместно  с  другими
участниками ("вместе с", "совместно") [13].
Возникает  вопрос  —  какое  из  этих  трех  значений  считать  базовым  и  зафиксировать  в
названии?  Логически  —  значение  простой  совместности    Associative,  которое  можно
вычленить  в  реципроке  и  ассистиве,  но  термин    Associative  практически  не  используется  в
тюркологии и известен лишь узкому кругу типологов. С другой стороны, «реципрок», хотя и
не  покрывает  всего  разнообразия  значений  взаимно-совместного  залога,  используется
традиционно и знаком пользователю, поэтому в качестве прототипа был выбран именно этот
термин.

Таблица 2. Залоги
Наименование
Морфемы
Обозначение
Действительный (основной) залог
-
ACT
Страдательный залог (пассив)
-Ыл:-ыл/-ел/-л
PASS
Возвратный залог (рефлексив)
-Ын:-ын/-ен/-н
REFL
Взаимно-совместный залог (реципрок)
-Ыш:-ыш/-еш/-ш
RECP
Понудительный залог (каузатив)
-Д[Ыр]: -т/-тыр/-тер/-дыр/-дер
CAUS

4.

Императив
Еще одной серьезной проблемой при разработке системы морфологических обозначений
стали  формы  императива  и  разграничение  их  от  желательного  наклонения  (оптатива).  Как
правило,  в  тюркских  языках  фиксируется  шестичленная  парадигма  императива,  хотя  среди
тюркологов продолжаются дискуссии о включении в ее состав форм 1-го и даже 3-го лица
[16].
Так,  формы  татарского  глагола  3  лица  на  –сЫн:  барсын  ‘пусть  пойдет’  могут  быть
интерпретированы как «императив 3 лица», либо «юссив».
В современной лингвистике используются разные названия для категорий, выражающих

180

побуждения  не  второго  лица.  Так,  в  известной  монографии  по  типологии  императива  [14]
приняты термины «императив 1-го лица», «императив 3-го лица» . Однако императив 3 лица
имеет  свою  специфику  —  это  повеление  дистантное  и  опосредованное,  косвенное,  а  не
прямое,  как  в  случае  2-го  лица.  Для  обозначения  косвенного  побуждения,  адресованного
третьему лицу, в современных работах по типологии используется термин «юссив». Юссив
«выделяется  из  других  императивных  форм  тем,  что,  адресуя  побуждение  к  3-му  лицу,
говорящий не имеет возможности контролировать ситуацию, поскольку адресат побуждения
находится  вне  коммуникативной  ситуации.  Степень  контроля  над  ситуацией  при
побуждении 2-го лица (слушающего) значительно выше» [6].
С  другой  стороны,  встает  вопрос  и  об  интерпретации  форм  побуждения  1  лица.  В
грамматиках последних десятилетий выделена категория желательного наклонения [14, 15].
При  этом  отмечается  дефектность  этой  категории:  имеется  только  форма  1  лица
единственного  и  множественного  числа.  Но  основная  проблема  заключается  в  том,  что
значение желательного наклонения в татарском языке и желательного наклонения (оптатива)
в  других  языках  имеют  принципиальные  несовпадения.  Подробнее  об  этом  написано  в
работе [7].
В более старых работах по тюркологии также прослеживается тенденция    рассматривать
формы  типа  барыйм,  барыйк  в  парадигме  императива.  Так,  В.Н.Хангильдин  не  признает
синтетических  форм  желательного  наклонения.  По  его  мнению,  значение  желания
передается  глаголами  повелительного  наклонения,  выражаемого  с  помощью  аффиксальной
морфемы -АйЫм:-ыйм/-им [17].
Формы  2  лица  получают  пометы  императива  единственного  и  императива
множественного  числа  (IMP_SG  и  IMP_PL);  формы  1  и  3  лица  обозначаются  на  основе
терминологических  прототипов  «гортатив»  и  «юссив»  (HOR  и  JUSS),  однако  в
пользовательском
интерфейсе
разрабатываемых
программ
будут
предлагаться
альтернативные  варианты  («гортатив»,  «желательное  наклонение»  и  «императив  1  лица»,
соответственно – «юссив», «императив 3 лица»).

Таблица 3. Императив
Название
Обозначение
Морфемы
1 лица (гортатив) ед.числа
HOR_SG
-ЫЙм: -ыйм/-им
1 лица (гортатив)  мн.числа
HOR_PL
-ЫЙк: -ыйк/-ик
2 лица ед.числа
IMP_SG
-
2 лица мн.числа
IMP_PL
-[Ы]гЫз: -ыгыз/-егез/-гыз/-гез
3 лица (юссив) ед.числа
JUS_SG
-сЫн: -сын/-сен
3 лица (юссив) мн.числа
JUS_PL
-сЫн+ЛАр: -сыннар/-сеннәр

Подобная специфика обозначений: движение от реальных аффиксов, то есть по существу
— обозначение (разметка) аффиксов, выведение грамматических категорий и значений через
материально  выраженные  аффиксы,  проявляется  и  при  обозначении  некоторых  других
категорий.

Заключение
Эту  систему  обозначений  планируется  также  использовать  в  других  компьютерных
разработках, которые ведутся в институте “Прикладная семиотика”, в частности в татарском
электронном корпусе “Туган тел” для осуществления морфологической разметки корпуса.
Предлагаемая  система  обозначений  подходит  для  представления  морфологических
категорий  глаголов  татарского  языка,  а  для  возможности  ее  использования  в  других
тюркских языках требуется небольшая доработка.

181

Литература
1.

Володин А.П., Храковский В.С. Об основаниях выделения грамматических категорий //
Проблемы лингвистической типологии и структуры языка / Отв. ред. В.С.Храковский.  - Л.:
Наука, 1977. - С.42-54.
2.

Гильмуллин  Р.А.,  Невзорова  О.А.,  Хакимов  Б.Э.  Корпус  татарских  текстов:  проблема
репрезентативности  // Труды  международной  конференции  «Корпусная  лингвистика-2011».
27-29  июня  2011  г.,  Санкт-Петербург.  –  СПб.:  С.-Петербургский  гос.  университет,
Филологический факультет, 2011.
—
С. 125-130.
3.

Гузев  В.Г.,  Бурыкин  А.А.  Общие  строевые  особенности  агглютинативных  языков
//Acta linguistica Petropolitana. Труды ИЛИ РАН.  - Т. 3.  - Ч. 1.  - СПб., 2007.  -  С. 109-117)  //
http://www.philology.ru/linguistics1/guzev-burykin-07.htm
4.

Кибрик А. Е.,  Архипов А. В.,  Даниэль М. А.,  Кодзасов,  Майерс Т.,  Нахимовский А. Д.
Технологии  обработки  языковых  данных  в  документировании  малых  языков  //
http://www.dialog-21.ru/digests/dialog2007/materials/html/35.htm
5.

Краткий справочник по современному русскому языку / под редакцией П.А.Леканта. -
М.: Высшая школа. 1995. - 382 с.
6.

Добрушина  Н.Р.  Семантическая  зона  оптатива  в  нахско-дагестанских  языках  //
Вопросы
языкознания.

2009.
—
№
5.
—
С.
48-75.
hse.ru›data/2011/10/11/1270415648/Dobrushina.pdf.
7.

Добрушина  Н.Р.  Оптатив  или  императив?  //Мишарский  диалект  татарского  языка:
Очерки по синтаксису и семантике / Под ред. Е.А.Лютиковой, К.И.Казенина, В.Д.Соловьева,
С.Г.Татевосова. — Казань: Магариф, 2007. – С. 252-266
8.

Жеребило Т.В. Фрагмент словаря лингвистических терминов.
9.

Мусаев К.М. Казахский язык: учебник / К.М. Мусаев; ин-т стран Азии и Африки МГУ
имени М.В.Ломоносова. — М.: — Вост. Лит., 2008. — 367с,
10.

Национальный  корпус  русского  языка.  Семантика  //  http://www.ruscorpora.ru/corpora-
sem.html (дата обращения: ).
11.

Невзорова  О.А.,  Салимов  Ф.И.,  Хакимов  Б.Э.,  Гатиатуллин  А.Р.,  Гильмуллин  Р.А.,
Галиева  А.М.,  Якубова  Д.Д.,  Аюпов  М.М.  Семантико-грамматическая  аннотация  в  русско-
татарской  лексикографической  базе  данных  /  О.А.  Невзорова,  Ф.И.  Салимов, Б.Э.
Хакимов, А.Р.  Гатиатуллин, Р.А. Гильмуллин, А.М. Галиева, Д.Д. Якубова, М.М.  Аюпов. //
Филологические науки. Вопросы теории и практики. – Тамбов: Грамота, 2012. - №7 (18): в 2-
х ч. Ч. I., с. 141- 146.
12.

Плунгян В.А. Общая морфология: Введение в проблематику. - М.: Едиториал, 2003. -
384 с.
13.

Плунгян В.А. Классификация элементарных глагольных значений, используемых в БД
“Verbum” // http://www.mccme.ru/ling/verbum.html
14.

Татар грамматикасы. – Т.2. – М.: ИНСАН, Казан: ФИКЕР, 2002. — 448 б.
15.

Татарская грамматика: В 3т. Т.2, Морфология / Рос. АН, АН Татарстана, Ин-т яз., лит.
и ист. им. Г.Ибрагимова; Казан. Науч. центр; Редкол.: М.З.Закиев и др..—Казань: Татар. кн.
Изд-во, 1993.—397 с..
16.

Типология  императивных  конструкций  /  Отв.  ред.  В.С.Храковский.  -  СПб.:  Наука,
1992. - 301 с.
17.

Хангилдин  В.Н.  Татар  теле  грамматикасы  (морфология  һәм  синтаксис)  /  В.Н.
Хангилдин;  СССР  ФА,  Казан  филиалы,  Тел,  әдәбият  һәм  тарих  ин-ты.—  Казан:  Татарстан
китап нәшрияты , 1959.—641б.

182

С. Ж.КАРАБАЕВА, А.И.ИМАНАЛИЕВА

Кыргызский государственный университет строительства, транспорта и архитектуры
им. Н.Исанова, Бишкек, Кыргызстан

ИСПОЛЬЗОВАНИЕ ГРАММАТИЧЕСКИХ ПРАВИЛ В ПРОЛОГе
(на примере кыргызского языка)

This article describes the three stages of technology, parsing sentences in the Kyrgyz language.
The first stage provides the basic definitions and concepts that allowto record a formal language, as
a
certain
mathematical
object.
In
the
second
stage  we  create  a  model  with  details  of  the  list  word,  with  each  link  and  their
dependence  relations.  In  the  third  stage  we  construct  a  two-stage  level  of  words  in  the  Kyrgyz
language.
Настоящая статья описывает три этапа техники разбора предложений кыргызского языка.
На  первом  этапе  даются  основные  определения  и  понятия,  позволяющие  записать
формальный
язык
как
некоторый
математический
объект.
Навтором
этапе  мы  создаем  модель  с  детали  головы  списка,  каждое  звено  и  их
зависимость  отношений.На  третьем  этапе  построим  двухступенчатый  уровень  слов
кыргызского языка.
Ключевые  слова:  формальный  язык,  формальные  модели  языка,  список,  цепочка,
синтаксис, семантика.
Известный  кыргызский  ученый  Касым  Тыныстанов  в  своих  научных  исследованиях
поставил задачу создать список всех кыргызских слов.
Но,  как  известно  из  психологических  исследований,  если  даже  очень  умный  человек
попытается вспомнить информацию одного типа, то одна информация повторится, а другая
может забыться.
Поэтому, Касым Тыныстанов  составил из нескольких вертикальных таблиц кыргызский
алфавит (на основе латыни), он выписывал слова, которые получались путем сдвига таблиц
.
Конечно,  чтобы  ускорить  подбор  К.  Тыныстанов  применил  некоторые  грамматические
особенности.

Ему удалось создать остроумный алгоритм, использовав, который он придумал простое и
оригинальное  техническое  средство,  названное  «технической  таблицей».  С  помощью  этого
средства за короткий промежуток времени, Касым Тыныстанов собрал богатый лексический
запас кыргызского языка, содержащий около ста тысяч слов.
Известный профессор-полиглот Е. Д. Поливанов в отзыве о научной деятельности Касыма
Тыныстанова  в  1935  г.  писал  «…1)  начав  с  задания  лексикологического  характера,
К.Тыныстанов  самостоятельно  изобрел  оригинальный  способ  (и  технический  прибор)  для
исчерпывающего  обследования  словарного  запаса  в  индивидуальном  языковом  мышлении
(изобретение это может иметь большое теоретическое и прикладное значение); 2) работа над
словарем привела К. Тыныстанова к вопросам так называемой морфонологии…» .
В  первой  половине  ХХ  века  из  идей  и  трудов  таких  мыслителей  появилась  нынешняя
наука информатика.
I.

Рассмотрим основные понятия теории формальных языков.
Язык  (искусственный  и  естественный)  состоит  из  трех  основных  компонентов:  словаря,
синтаксиса и семантики.
Формальные  языки,  так  же  как  и  языки  естественные,  можно  рассматривать  с  точки
зрения  их  формы,  структуры,  иначе  говоря,  синтаксиса,  и  с  точки  зрения  смысла,
вкладываемого  в  приложения  языка,  т.е.  семантики.  Синтаксический  анализ  формальных
языков во многом напоминает известный по школе грамматический разбор предложений.

183

Словарь языка содержит множество лексем.
Словарь – это конечное множество элементов, называемых символами.
Пусть задан словарь V.
Цепочка над словарем V- это произвольная упорядоченная последовательность символов
словаря. Например, V={a, b, c} – это словарь. a=aabc – цепочка, β – bbaaca – другая цепочка.
Пустая цепочка – это цепочка, не содержащая символов ( .
Пусть  V–  некоторый  словарь.  V
*
-множество  всех  возможных  цепочек,  составленных  из
символов словаря V, включая пустую цепочку .
Необходимой  составляющей  описания  любого  языка  является  его  алфавит,  т.е.  непустое
конечное  множество  элементов  (символов),  из  которых  состоят  предложения  языка.  Будем
обозначать алфавит следующим образом:
А=
.
Всякая  конечная  последовательность  символов  алфавита  называется  цепочкой  (строкой
или списки). Допускается существование пустой цепочки (или списки).
Длина
цепочки
записывается
как
.  Таким  образом,
если  ABC,  AABB,  []  есть  цепочки,  то
  =  3,
=4,  []=0.  В  заглавные  буквы
обозначают символы языка, а строчные – цепочки символов, т.е.

Конкатенацией (сцеплением) цепочек и  называется цепочка Z, состоящая из цепочки х
и  дописанной  в  след  цепочкой  у.  Конкатенация  цепочек  х  и  у  обозначается  как  ху.  Если
х=АВС, y=DEF, то xy=ABCDEF. Если z=xy, то z=ху, то х-голова, а у –хвост цепочки (списка)
z. Будем обозначать множество цепочек через
и т.д. Произведением
двух множеств
цепочек
является множество, состоящее из всех комбинацией цепочек

=

Если
то
=

ababcabdabcd

Видно,  что  произведение  множеств  не  коммуникативно,  т.е.
.  Множество,
состоящее из пустой цепочки   можно обозначить, как []. Для этого множества справедливо
[]  = [] = .
Теперь  можно  определить  понятие  степени  множество  цепочек:
  и
n
={xxx…x, /x
.
Если ={x}, то можно говорить 0 степени цепочки
х
n
=xxx…x(nраз)
x
0
=[].
Аналогично, понятие степени можно распространить и на алфавит
A
0
={[]}? A
1
=A,A
n
=AA
n-1
дляn>0.

Семантика – совокупность правил интерпретации лексем и языковых конструкций.
Семантическими интерпретации и представления текстов на естественном языке является
важной  задачей  обработки  естественного  языка.  Количество  себе  семантических
представлений  были  использованы  представляют  собой  естественное  язык  с  помощью
концептуальных представлений.
Основная  сложность  построения  транслятора  состоит  в  том,  что  число  возможных
программ  на  входе  бесконечно.  Транслятор    должен  обрабатывать  любую  программу  из
этого  множества,  сама  программа  может  иметь  любую  сложность.  Для  построения
транслятора  необходимо  иметь  ведущую  идею,  позволяющую  вычислить  значение  любой

184

входной  программы,  выражая  это  значение  на  выходном  языке  или  в  последовательности
действий.
II.   Одна из таких идей – метод синтаксически-ориентированной трансляции, основанный
на  работах  американского  ученого  Ноэля  Хомского.  На  основании  изучения  механизма
понимания смысла естественного языка ученый пришел к выводу, что существенную роль в
этом  процессе  играет  этап  построения  структуры  предложения,  которую,  в  свою  очередь,
используют  для  «вычисления»  смысла  предложения.  Например  ,  «Порядок  сменит  хаос».
Предложение имеет 2 смысла :
1-й – вместо хаоса будет порядок.
2-й – вместо порядка будет хаос.
Из гипотезы Хомского следует, что семантический анализ сводится к синтаксическому и
состоит  из  двух  процедур:  распознавания  структуры  входного  предложения;  построения
выходного текста (действий) на основе этой структуры.

Тартипалмаштыруу        хаос

Рисунок 1. Структура предложения – вариант – 1.

Разбор помогает понять отношения между словами в предложении. Он играет важную
роль  в  большом  количестве  приложений,  таких  как  машинный  перевод,  неоднозначности
смысла  слова,  поисковые  системы,  диалоговых  систем  и  т.д.  Анализаторы  в  основном
подразделяются на две категории - грамматика и управляемых данными приводом.

ЭЭ
баяндооч
сүйлѳм

Зататооч
этиш
Толуктоочт
обу
Зататооч

185

Тартипалмаштыруу       хаос

Рисунок 2. Структура предложения – вариант -2.

Чтобы  применить  математический  подход  к  проблемам,  связанным  с  языками  и  их
обработкой,  необходимо  ограничиться  множество  цепочек,  которые  можно  определить
некоторым  точным  образом.  Существуют  различные  способы  точного  задания  таких
множеств.  Один  из  них  заключается  в  задании  языка  как  множества,  допускаемого  каким-
нибудь  распознавателем  цепочек  вроде  конечного  автомата.  Другой  –  в  использовании
методов, которые можно считать грамматическими.

Термин  «формальная  грамматика»  применим  к  любому  определению  формального
языка, основанному на грамматических правилах, с помощью которых можно порождать и
анализировать  цепочки  аналогично  тому,  как  грамматики  используют  при  изучении
естественных языков.
III.  Рассмотрим  формальную  грамматику,  которая  в  какой-то  степени  напоминает
фрагмент грамматики кыргызского языка и задает формальный язык, состоящий из четырех
кыргызских предложений. Такой грамматике используют элементы,  играющие роль членов
предложение или частей речи:
Синтаксис  –  совокупность  правил  построения  языковых  конструкций  (предложений)  из
лексем.
Синтаксический  анализ  является  очень  важным  приложением  Пролога  и  логического
программирования.  В  действительности,  происхождение  Пролога  связано  с  попыткой
использовать  логику  для  выражения  грамматических  правил  и  формализации  процесса
синтаксического разбора.
Элементы, приведенные в грамматике, такие как <подлежащие> или <существительное>,
играющие  роль  членов  предложения  или  частей  речи,  называют  нетерминальными
(вспомогательными)
символами,
или
нетерминалами.
При
определении
языка
программирования нетерминалами служит такие элементы, как <оператор>, <выражение> и
т.д.
Не терминалы – это конструкции языка.
Грамматика может содержать любое количество терминалов. В языках программирования
терминалами  являются  используемые  в  них  слова  и  символы,    BEGIN,  DO,  +  и  т.д.
Терминалы – это символы предложений порождаемого языка.
Наиболее распространенным подходом к реализации синтаксического разбора средствами
Пролога является использование грамматик, задаваемых определительными предложениями
(definiteclausegrammar, DCG). DC-грамматики являются некоторым обобщением контекстно-
свободных грамматик. Контекстно-свободные грамматики определяются множеством правил
вида
<нетерминал><тело>,
сүйлѳм

Баяндоочтунтобу
Ээнинтобу
толуктоочтунтобу
Зататооч
этиш
Зататооч

186

Где  нетерминал  является  нетерминальным  символом,  а  тело-последовательностью  из
одного  или  нескольких  элементов,  разделяемых  запятыми.  Каждый  элемент–это  либо
нетерминальный символ, либо последовательность терминальных символов. Смысл правила
в  том,  что  тело  есть  возможная  форма  грамматической  группы  нетерминального  типа.
Нетерминальные  символы  записываются  как  атомы  Пролога,  а  последовательности
терминальных  символов  -  в  виде  списков  атомов.  Это  облегчает  трансляцию  грамматик  в
Пролог-программы.
Для  каждого  нетерминального  символа  S  грамматика  определяет  язык,  который
представляет  собой  множество  последовательностей  терминальных  символов,  получаемых
путем  повторного  недетерминированного  применения  правил  грамматики,  начиная  с
символа S.
Рассмотрим  простую  контекстно-свободную  грамматику  для  небольшого  подмножества
кыргызского  языка.  Первое  правило  грамматики  читается  так:  “Предложение  состоит  из
группы существительного, за которым следует группа глагола”.
сүйлѳм(с(Q,V)) -->зататооч(Q), этиш(V).
зататооч(з(кыз))--> [кыз].
зататооч (з(китеп))--> [китеп].
зататооч(з(кагаз))--> [кагаз].
зататооч(з(кой))--> [кой].
зататооч(з(ит))--> [ит].
этиш(эт(секирди)) --> [секирди].
этиш(эт(бакырды)) --> [бакырды].
этиш(эт(иштеди)) --> [иштеди].
этиш(эт(чуркады)) --> [чуркады].
1 ?- сүйл
ѳм(S,L,[]).
S = с(з(кыз), эт(секирди)),
L = [кыз, секирди].
… … … … … …
S = с(з(ит), эт(чуркады)),
L = [ит, чуркады].

Грамматические правила: предложения -- >группа_существительного, группа_глагола.

Рис.3. модель простой контекстно-свободной грамматики

Примером  для  реализации  восходящей  грамматики  с  рекурсивными  правилами  является
синтаксический  анализатор  математических  выражений.  Такая  система  начинает  работу  с
данными и переходит к простым синтаксическим объектам, а затем и к более сложным. В то
время  как  система  нисходящего  разбора  управляется  в  основном  гипотезами,  система
восходящего грамматического разбора управляется данными.

187

Разбор  предложения  можно  рассматривать  как  нахождение  зависимости  отношения
некоторой  парыслов  в  предложении.  Слова  должны  быть  связаны  таким  образом,  что  они
образуют  ровную  древовидную  структуру,  где  узлы  являются  словами,  ребра  назначаются
между парами слова,которые являются связанными уровнем именем отношений.

жүктеу/скачать 8,57 Mb.

Достарыңызбен бөлісу:

1 ... 17 18 19 20 21 22 23 24 ... 39