280
1. Лингвистические проблемы - определение состава словника для выбранной области,
установление запаса сведений, которые должны содержаться в словаре, и построение
словаря, выбор типа грамматики и построение грамматической модели.
2. Математические проблемы - разработка общей структуры алгоритма перевода. Разра-
ботка алгоритмов отдельных этапов, разработка формализмов для записи лингвистических
данных и для разработки алгоритма.
3. Проблемы машинной реализации - разработка способов хранения данных, создание
системы программирования, разработки комплекса программ реализующих различные
алгоритмы моделирования, а также разработка разного рода программ обслуживания.
Математическое описание языка основано на представлении о «правильных текстах».
Правильный текст определяется как последовательность речевых единиц, подчиняющаяся
определённым закономерностям, другими словами, правильный текст – это предложение,
построенное по строго определённым правилам. Множеством узлов этого предложения (П)
служат слова, входящие в П. Среди узлов – один корень, не подчинённый никакому узлу.
Нельзя, отправившись из какого-либо узла вдоль стрелок, вернуться в тот же узел. Узлы
дерева подчинения – это вхождения слов в предложения. Формально для каждого (не
слишком короткого) предложения можно построить много разных синтаксических структур
любого из двух видов, но среди них либо одна или несколько являются правильными.
Корнем правильного дерева подчинения служит обычно сказуемое.
Более совершенное представление синтаксической структуры предложения (требующее,
однако, более сложного математического аппарата) дают системы синтаксических групп, в
которые входят как словосочетания, так и синтаксические связи, причём не только между
словами, но и между словосочетаниями. Системы синтаксических групп позволяют совме-
щать строгость формального описания строения предложения с гибкостью, присущей тради-
ционным, неформальным описаниям. Деревья подчинения и системы составляющих явля-
ются предельными частными случаями систем синтаксических групп.
Другой раздел математической лингвистики, занимающий в ней центральное место -
теория формальных грамматик, начало которой было положено работами Н. Хомского [1].
Она изучает способы описания закономерностей, характеризующих уже не отдельный текст,
а всю совокупность правильных текстов того или иного языка.
Современные функционирующие системы МП обеспечивают лишь 40-55% синтактико-
семантической правильности текста перевода, что подтверждает их все еще слабой форма-
лизованности [2], т.к. именно строгая математическая формальность языка может обеспечить
высокую степень в точности перевода. Хотя известно, что формализация любого естест-
венного языка относится к категории трудно решаемых проблем. Следует отметить, что
особенно актуальны проблемы формализации узбекского языка и внедрения систем МП с
включением узбекского языка в многоязычную ситуацию. В связи с этим проведение науч-
ных исследований в области формализации естественных языков, разработка и внедрение
многоязычных систем МП требует необходимых теоретических выкладок. В настоящей
работе изложены основные понятия (аксиомы) для формальных систем МП в многоязычной
ситуации.
Достарыңызбен бөлісу: