The alphabet transformation should be completed as soon as possible.
References
[1] İ. Ergenç, “Konuşma Dili ve Türkçenin Söyleyiş Sözlüğü”, Multilungual Yabancı Dil
Yayınları, ISBN 975-6542-06-x, 2002
[2] M. Ş. Ülkütaşır, “Atatürk ve Harf Devrimi”, TDK yayınları : 384,ISBN 975-16-0361-7,
2000
[3] B. N. Şimşir, “Türk Yazı Devrimi”, TDK yayınları : ISBN:9751604206, 1992
С.Ж. МУСАЕВ, С. Ж.КАРАБАЕВА, А.И.ИМАНАЛИЕВА
Кыргызский государственный университет строительства, транспорта и архитектуры
им. Н.Исанова, Бишкек, Кыргызстан
ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ РАЗВИТИЯ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ В
КЫРГЫЗСТАНЕ
Сегодня важную роль в жизни современного общества играют автоматизированные
информационные технологии. Все люди должны иметь возможность пользоваться
преимуществами глобальных информационных ресурсов. В настоящее время ИНТЕРНЕТ
состоит из миллиарда страниц информации и продолжает разрастаться. Однако при этом
«всемирная паутина» представляет собой чрезвычайно демократичную среду, состоящую из
неисчислимого количества Web-сайтов, создаваемых отдельными лицами и неформальными
группами. Виртуальные сообщества людей, разбросанные по всему земному шару, но
объединенные общими интересами, обсуждают буквально все, начиная с языков,
находящихся под угрозой исчезновения, и кончая особенностями национальной культуры.
В XXI веке в мире формируется разделительная граница между странами, создающими
информационное общество, и странами, отстающими в области информатизации. Новое
разделение мира на развитые и отстающие страны - это «цифровое или информационное
разделение», показывающее уровень информатизации государств. Поэтому государственные
органы любой страны вынуждены принимать определенные меры, чтобы не попасть в
группу «информационно отсталых» стран.
До 2000 года кыргызское языкознание развивалось практически без привлечения
математических аппаратов и возможностей вычислительной техники для создания и
изучения языковых моделей.
Начиная с 1990 года, Институт теоретической и прикладной математики Национальной
академии наук Кыргызской Республики ведет работу по алгоритмизации кыргызского языка.
Разработан и реализован на компьютере единый алгоритм словоизменения в кыргызском
35
языке, составлена контрольно-обучающая программа со случайным формированием заданий,
которая используется в учебных заведениях.
В системах обработки знаний на естественном языке одной из центральных является
задача разработки лингвистических ресурсов. Лингвистические ресурсы представляют собой
базы данных, включающие концептуальную информацию в виде различных словарей,
парадигматических и формальных моделей естественного языка, а также специализированые
лингвистические процессоры обработки самой модели.
На сегодняшний день необходимый уровень решения проблем моделирования, процесса
понимания смысла текстов и проблемы синтеза речи у нас пока еще не достигнут, хотя
работы в области компьютерной лингвистики ведутся во всех развитых странах мира. Тем не
менее, можно отметить серьезные научные и практические достижения в области
компьютерной лингвистики.
В последние 10 лет существования суверенной Кыргызской Республики процесс
информатизации общества вышел на новый уровень. Каждый год число пользователей
глобальной сети ИНТЕРНЕТ увеличивается в геометрической прогрессии. Стремительно
растет сам рынок информационных технологий, что в свою очередь вызывает рост
потребности в соответствующих специалистах.
Лингвистика! Она должна повернуться лицом к новым задачам, выдвигаемым
компьютеризацией. Компьютерная лингвистика в настоящий момент находится на подъеме в
Кыргызстане. Для отечественных лингвистов недавно открылись те области приложения
знаний о языке, которые традиционны для зарубежного сообщества профессиональных
лингвистов. В Кыргызстане появляется спрос на лингвистов, работающих в области рекламы
и в сфере публичной политики и в связи с этим появилось необходимость открытия в ВУЗах
таких специальностей. С 2007 года в Кыргызском государственном университете
строительства, транспорта и архитектуры им. Н. Исанова начала свою работу новая кафедра
«Компьютерная лингвистика».
Кафедра компьютерной лингвистики Кыргызского государственного университета
строительства, транспорта и архитектуры им. Н.Исанова основана в 2007 году и является
выпускающей кафедрой, которая готовит специалистов в области компьютерной
лингвистики применительно к кыргызскому языку. Нужных и востребованных специалистов
на сегоднящний день. Так как на рынке труда специалисты по компьютерной лингвистике на
сегодняшний день очень востребованы, а программы адресной подготовки компьютерных
лингвистов необходимы.
Компьютерную лингвистику могут изучат люди с разным базовым образованием. Был бы
у них интерес к растущим сейчас в цене и популярности лингвистическим технологиям,
которые они смогут применить в уже знакомой или совсем новой для них области. Это могут
быть и лингвисты, и математики, и социологи, и даже маркетологи — никаких специальных
ограничений здесь нет.
На кафедре ведутся работы по созданию компьютерных лингвистических моделей для
кыргызского языка и готовятся лингвистические ресурсы. В частности, подготовлен
электронный словарь терминов по информационным технологиям на кыргызском языке.
При внедрении кыргызского языка в компьютерные технологии предполагается
разработка пакетов прикладных программ для автоматизации профессиональной
деятельности и для автоматизации обработки текстов на кыргызском языке, создание
кыргызско-язычного интерфейса для пользовательских систем.
Под руководством директора института новых информационных технологий Бейшенбека
Такырбашевича Укуева и корпорации Microsoft был переведен Windows-7, версия office -14
интерфейс на кыргызский язык.
Выпускники специальности «Компьютерная лингвистика» на проектировании дипломных
проектов разрабатывают новые обучающие мультимедийные программы английского и
кыргызского языков. А также студенты кафедры работают над разработкой перевода на
36
кыргызский язык сайтов Facebook, Twitter, Google и Wikipediа и улучшения качества их
работы.
В свете очерченных перспектив, диктуемых жизнью назрела необходимость и в
специальных отечественных учебных изданий, статьей и журналов по компьютерной
лингвистике.
Поток зарубежных публикаций по вопросам компьютерной лингвистики огромен.
Выходит много монографий, сборников, издаются журналы «Компьютерная лингвистика».
Ежегодно проводится не менее десятка международных научных симпозиумов по
компьютерной лингвистике, по машинному переводу, по применению компьютеров в
управлении, в гуманитарных науках, в словарном деле, в обучении и т. д.
Проблема в том, что на сегодняшний очень нужны организация ежегодных конференций,
симпозиумов и форумов по компьютерной лингвистике для обсуждения проблемы
компьютеризации тюркских народов на ряду с лингвистикой, а также издание монографий,
сборников и журналов в тюркоязычных странах. Евразийский национальный университет
имени Л.Н. Гумилёва, Министерство образования и науки Республики Казахстан совместно с
Академией наук Республики Татарстан организовали 1-ую Международную конференцию
на тему "Компьютерная обработка тюркских языков. Латинизация письменности". Для того,
чтобы компьтерная лингвистика имела активное применение и развитие было бы хорошо
организация ежегодных конференций в тюркоязычных странах и это стало бы мощным
инструментом, ведущим наши народы к научному прогрессу, который будет сближать
тюркие народы. Сегодня в тюркоязычных странах делается немало по работе компьютерной
лингвистике и современные ученые тюркского мира должны работать сообща над созданием
и использованием терминов информационных технологий. Уже второй раз был проведен
форум по теме «Стандартизация и унификация терминов информационных технологий
тюркоязычных стран», который был организован Ассоциацией информатиков Турции
господином Кораем Озером и профессором университета Хаджеттепе в Турции Шукру
Халык Акалином.
В настоящее время перед кыргызскими учеными стоят проблемы преобразовании и
компьютеризации кыргызского языка. Проблемы преобразовании кыргызского языка
заключается в стандартизации орфографии кыргызского языка. Мы сталкиваемся с
трудностями и сложностью при проведении семантического анализа текста или в машинном
переводе на компьютере. При переводе парных слов « ата мекен, бака жалбырак, кѳз
мончок, үч бурчтук и т.д.» с помощью машинного перевода компьютер переводит каждое
слово отдельно например, ата мекен – ата (отец) и мекен (родина) при морфологическом
разборе үч бурчтук – үч (числительное) и бурчтук (существительное). Для устранение этих
проблем нам приходится писать эти слова слитно при проведении семантического анализа
слова, необходимо разработать такой механизм устранения орфографических норм
кыргызского языка.
Для проведения научно-прикладных работ по созданию машинного фонда кыргызского
языка, кыргызского речевого интерфейса, функционально-структурной модели кыргызских
морфем как формальной и информационно-справочной базы при построении
лингвопроцессоров, морфологических и синтаксических анализов, генерации текста,
распознавания и синтеза речи, интерпретации смысла тестов, семантический поиск в
интернете, разработок обучающих игровых программ на кыргызском языке необходимы
немалые деньги. Эти проблемы в республике можно успешно осуществлять в рамках
Государственных программ.
В республике на сегодня практически полностью выполнен комплекс организационных и
директивных мероприятий и создана необходимая база для обеспечения функционирования
кыргызского языка в компьютерных технологиях. Под руководством д. ф-м. н., профессора
Павела Сергеевича Панкова, который работает над этой тематикой, выполняется немало
работ по компьютеризации кыргызского языка.
37
Составлен полный список аффиксов в кыргызском языке, составлен словарь терминов по
информационным технологиям на кыргызском языке.
Разработано новое понятие субъекта, как перманентно неустойчивого объекта такого, что
малые по энергии внешние воздействия (команды) вызывают у него большие по энергии
существенно различные реакции и изменения внутреннего состояния, и введено новое
понятие языка, как системы таких команд.
Введено и реализовано на компьютере определение математической модели понятий,
давшее возможность неязыкового независимого представления естественных языков.
На ряду с этими работами в 2002 году Э.Д. Асанов создал программу «Тамга-КИТ».
Внедрение, дополнение и развитие этой программы стало главным путем в компьютеризации
кыргызского языка.
Данная программа состоит из 20 компонентов, для того чтобы можно было использовать
кыргызский язык. «Тамга-КИТ» облегчает работу на кыргызском языке и эта программа дала
широкий путь в развитии политики государственного языка в информационной сфере.
Главная особенность программы «Тамга-КИТ» - это возможность проверять
грамматику (орфографию, стилистику) текстов на кыргызском языке. Стратегия программы
основано на социально-коммуникационном развитии государственного языка в
сопровождение с современными информационными технологиями.
В 2011 году был создан языковый пакет «KyrSpell 2.2 - Проверка орфографии
кыргызского языка для MS Office 97-2013» специально для кыргызского языка.
Данный комплект программ позволяет проверять на орфографические ошибки, находит
синонимы, антонимы а также родственные слова (функция тезаурус), и кроме этого
осуществлять расстановку переносов текстов на кыргызском языке в приложениях MS
Office. Проверка орфографии осуществляется стандартными средствами, что обеспечивает
проверку в любых приложениях, где существует соответствующая функция (например, в MS
Word, MS Excel, MS PowerPoint, MS Outlook, Outlook Express и др.)
Для прогресса в автоматизации обработки кыргызского языка необходимо разработать
следующее:
стандартизация орфографии кыргызского языка;
разработать и активно применять на практике корректор кыргызских текстов на
основе генеративной морфологии, помогающий пользователю обнаруживать и исправлять
ошибки в тексте, электронный русско-кыргызский словарь, словарь бытовых терминов,
англо-кыргызско-русский и русско-кыргызский словники компьютерных терминов,
электронные многоязычные словари, толковые словари и орфографические словари;
разработать и реализовать на компьютере единый алгоритм словоизменения в
кыргызском языке, создать акустическую базу данных кыргызского языка и аппаратная
реализация распознавание и синтеза речи.
Таким образом когда мы сегодня говорим о компьютерной лингвистике, нужно понимать,
что области применения лингвистических технологий стремительно расширяются. При этом
следует придерживаться правила, что язык должен идти на ряду с техникой. В современную
эпоху глобализации и формирования информационной цивилизации важно решение проблем
развития единства тюркских народов и повышения статуса национальных языков и
формирования единого информационного пространства тюркских народов.
Кыргызский и казахский языки, как и другие тюркские языки, относятся к типу
агглютативных, и имеют стройные системы правил последовательного присоединения и
написания окончаний, с малым числом исключений.
С переходом бывших тюркоязычных стран в составе СССР на латинский алфавит
необходим переход национального языка к латинской системе алфавита. И необходимо
создать общетюркский единый алгоритм словоизменения в тюркских языках.
Осуществление вышесказанных предложений способствовала бы сохранению и развитию
каждого из тюркских народов, развитию тюркской цивилизации в системе глобальной
цивилизации.
|