Атты І халықаралық конференция ЕҢбектері



Pdf көрінісі
бет274/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   270   271   272   273   274   275   276   277   ...   326
Определение  19.  Низкая  технология  МП  из  языка  A  в  язык  B  есть  установление 
однозначности между грамматиками A(G) и B(G) в пределах 25-35%. 
Естественный человеческий язык с точки зрения математики представляет собой нечёткое 
или  размытое  множество  –  континуум.  Нечёткость  языка,  в  том  числе  значений  слов, 
словосочетаний и других лингвистических единиц обусловливается особенностями восприя-
тия и отражения объективной действительности в мозгу человека. Поэтому строение знака в 
математике  и  в  естественном  человеческом  языке  разное.  Знак  в  математике  –  это  двусто-
ронняя сущность. Знак в языке многозначен и многопланов.  
Потребность  математики  и  информатики  в  языковедении  и  прикладной  лингвистике 
связана  с  необходимостью  построения  алгоритмов,  позволяющих  быстро  и  эффективно 
извлекать  и  перерабатывать  информацию,  заключённую  в  научно-технических,  деловых  и 
художественных текстах, поток которых постоянно возрастает. Условием такой переработки 
является  перевод  информации,  содержащейся  в  неформализованном  виде  в  тексте,  на 
формализованный искусственный язык. Если речь идёт об автоматизированной переработке 
текста,  то  таким  искусственным  языком  является  расширяемый  входной  язык  математи-
ческого моделирования естественного языка [3].
 
Более  сложны  лингвистические  потребности  робототехники  и  теории  искусственного 
интеллекта. Обращаясь к опыту математической и прикладной лингвистики, исследователи 
ищут конструктивные решения применительно к формальному анализу нечётких объектов, к 
устранению многозначности языковых знаков и созданию алгоритмов высоких информаци-
онно-семантических уровней. Однако решение этих сложных задач невозможно без предва-
рительной разработки методов системного описания и моделирования парадигматики и син-
тагматики языка. 
Цель  математической  лингвистики  как  науки  состоит  в  том,  чтобы  изложить  элементы 
системного  анализа  языка  и  речи  с  помощью  аппарата  современной  математики  и  элемен-
тарных математических правил, приложимых к лингвистике. 
Наиболее  простыми  для  формализации  и  компьютерного  перевода  являются  тексты 
научного  характера  с  чётко  представленным  синтаксисом  во  взаимосвязи  с  ограниченным 
числом  морфологических  категорий.  Это  объясняется  тем,  что  термин,  т.е.  слово  в 
специфически научном употреблении, максимально приближен к математическому знаку по 
своей  сути,  что  позволяет  формализовать  конструкции  и  осуществить  переход  к  синтакси-
ческому анализу на основе представленных в базе данных морфологического характера. 


283 
 
Двусоставные предложения биноминальной структуры являются наиболее частотными и 
коммуникативно-значимыми в научных текстах.  
В настоящее время ведутся исследования именно в направлении математического модели-
рования  естественных  языков.  В  качестве  объектов  выбраны  узбекский,  русский,  английс-
кий, немецкий и турецкие языки. Разработана технология моделируемого компьютерного 


Достарыңызбен бөлісу:
1   ...   270   271   272   273   274   275   276   277   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет