Тілтаным языкознание



Pdf көрінісі
бет12/51
Дата04.12.2022
өлшемі1,33 Mb.
#54680
1   ...   8   9   10   11   12   13   14   15   ...   51
Байланысты:
ТІЛТАНЫМ-2017-3


раздельного синтеза именных и глагольных словоформ на базе словарей основ 
и аффиксов с учетом комбинаторных возможностей последних был предложен 
значительно раньше других, что является подтверждением научной интуиции 
ученого. Подтверждением этому являются подходы и при синтезе башкирской и 
хакасской словоформ. 
Фундаментальным вкладом А.К. Жубанова в казахскую прикладную лингвис-
тику, несомненно, является его докторская диссертационная работа, посвященная 
проблеме многоуровневого моделирования казахского текста, основные поло-
жения которой изданы отдельной монографией. Формализация семантико-
синтаксической организации текста предполагает использование некоторого 
искусственного языка, который был бы понятен компьютеру. Автором использован 
язык СЕМСИНТ, разработанный его научным руководителем А.В. Зубовым. Этот 
язык дает возможность описать содержание отдельного слова, предложения, абзаца 
и текста в целом. СЕМСИНТ содержит правила, учитывающие семантические и 
синтаксические отношения между текстовыми единицами, позволяющие строить 
их семантико-синтаксические формулы и на их основе выводить обобщенную 
семантико-синтаксическую формулу конкретного текста. 
Отметим, что работа такого характера проделана в тюркологии впервые, в ходе 
которого автором: 
– предложена семантическая классификация лексики знаменательных классов 
слов казахского языка;
– выявлены типы начальных, медиальных и конечных абзацев по их предметно-
А.Байтұрсынұлы атындағы Тіл білімі институтының «Тілтаным» журналы. 2017. №3


25 
логическому содержанию в трех функциональных стилях казахского языка: худо-
жественный, публицистический, научный;
– определены типы опорных слов; 
– изучены функционально-смысловые типы абзаца в зависимости от положения 
в тексте;
– составлены модели текстов разных функциональных стилей в виде лексико-
семантических формул.
Полученные результаты являются уникальным и ценным материалом, которые 
в дальнейшем, безусловно, будут использованы в разработке национальной интел-
лектуальной информационной системы, таких как: автоматическое реферирование, 
система автоматического сбора и классификации информации, контент анализа, 
автоматического порождения текста и др.
Осознавая важность филологических компьютерных баз данных как в плане 
источника для новых научно-теоретических изысканий, так и в плане автоматизи-
рованного справочника для широкого круга пользователей, Аскар Кудайбергенович 
в 2003 г. выступает в периодической печати с призывом к филологам и специалистам 
IT технологии объединить усилия в этой области. С этого момента А.К. Жубанов 
свои знания, опыт и талант организатора науки переносит в область разработки 
лингвистических баз данных казахского языка. 
В лингвистике выделяются собственно лингвистические базы данных и полно-
текстовые базы. Собственно лингвистические базы содержат информациюо 
лингвистических единицах различного рода: лексике, фонетике, морфологии, 
например, Международный компьютерный архив современного английского 
языка (International Computer Archive of Modern English – ICAME), базаданных рус-
ской терминологии «РОСТЕРМ» и др. Полнотекстовые базы содержат корпусы 
текстов, например, «Британский нацональный корпус английского языка», самый 
крупный в России «Национальный корпус русского языка», или «Компьютерный 
корпус текстов русских газет конца XX века».
В русле собственно лингвистических баз данных автором была разработана 
структура представления данных в лексикографической базе «Тiл – қазына». Лекси-
кографические базы данных представляют из себя многоуровневую структуру
хранящую всю необхидимую информацию, позволяющую производить различные 
операции поиска, доступа к различным информационным ресурсам и выводить для 
конечного пользователя в оптимальном для восприятии расположении компонентов 
данных базы. Основная трудность при разработке лексикографических баз данных 
заключается в том, что они создаются на базе изданных в печатной форме словарей. 
Структуры таких традиционных лексикографических трудов сильно различаются 
и не могут быть переложены напрямую в информационные базы. Автор изначально 
отказался от подхода создания разных форматов хранения данных для словарей с 
разными структурами. А.К. Жубановым были проанализированы все имеющиеся 
в казахском языкознании словари и выработана единая структура хранения данных 
в компьютерной лексикографической базе. 
Сегодня «Тiл – қазына» включет: лексикографическую картотеку Института 
языкознания им. А. Байтурсынова КН МОН РК, данные многотомного толково-
го словаря и всех прочих изданных словарей казахского языка. База данных снаб-
жена программной оболочкой, позволяющей проецировать данные на выходе в 
интуитивно понятные формы толкового, синонимического, орфоэпического сло-
А.Байтұрсынұлы атындағы Тіл білімі институтының «Тілтаным» журналы. 2017. №3


26
варей, двуязычных общих и терминологических словарей, генеральной картотеки 
Института язкознания им. А. Байтурсынова КН МОН РК. Например, в проекции 
картотеки пользователь получает такие параметры слова как иллюстрационный 
материал употребления слова с указанием автора, названия произведения, года 
выпуска, места издания, абзаца и пр. 
Данная база реализована как сетевая для научных сотрудников Института 
языкознания и является ценным источником для многих лингвистических иссле-
дований и лексикографических разработок. Так на его базе был подготовлен в 
сравнительно короткие сроки 15 томный толковый словарь казахского языка. 
Отдавая много сил научно-исследовательской работе, Аскар Кудайбергенович 
все же находит время и для разработки новых инновационных методик в области 
преподавания языка. Предложенные им методы оптимизации процесса обучения 
казахскому языку, такие как учет наряду с частотой употребления слова и параметра 
важности слова K (K= F·m/N·n) и созданные им программы автоматического его 
подсчета, нашли широкое применение в школах и вузах республики
Результаты многолетних исследований ученого, его идеи и открытия легли 
в основу разработки казахского национального корпуса, который создается в 
Институте языкознания им. А. Байтурсынова под руководством самого автора. 
Видение архитектуры национального корпуса, изложенное в его многочисленных 
научных трудах, разработанные им подходы к решению задач автоматического 
синтеза и анализа казахской словоформы, созданная база данных «Тiл – қазына» 
и его неустанная энергия и забота позволяют научному коллективу института, в 
нелегкие для науки годы, успешно его реализовывать. 
Аскар Кудайбергенович самый талантливый и яркий ученик Калдыбая 
Бектаевича, которому учитель и основатель математической лингвистики 
Казахстана передал в свое время руководство созданной им группой научных 
сотрудников при Институте языкознания им. А. Байтурсынова КН МОН РК. За 
прошедшие полвека группа стала лабораторией Автоматизации в лексикографии, 
затем была возведена в ранг отдела прикладной лингвистик. За эти годы 
Аскар Кудайбергеновичне только развил школу математической лингвистики 
К.Б.Бектаева, но и воспиталсвою школу, школу компьютерной лингвистики. 
Он является научным руководителем и консультантом и оппонентом ряда канди-
датских и докторских диссертаций. Им подготовлены научные кадры не только 
для казахской прикладной лингвистики, но и для башкирской. Автор этой статьи 
проходил в 1983-1984 гг. стажировку под руководством А.К. Жубанова в группе 
Автоматизации в лексикографии Института языкознания им. А. Байтурсынова 
КН МОН РК. Аскар Кудайбергенович был в дальнейшем научным консультантом 
моей кандидатской диссертации.
Темы, защищенных его учениками, диссертаций охватывают разнообразные 
направления прикладной лингвистики. Это подтверждает энциклопедичность и 
глубину его научных познаний в области математики, информатики и лингвистики. 
С большинством своих учеников Аскар Кудайбергенович был знаком, когда они 
учились в ВУЗе. Он читал и продолжает читать лекции, спецкурсы, проводит 
практические занятия для студентов, магистрантов и РhD докторантов Казахского 
национального университета им. аль-Фараби и Казахского Государственного 
национального педагогического университета им. Абая по прикладной лингвистике 
и по компьютерной лингвистике. 
А.Байтұрсынұлы атындағы Тіл білімі институтының «Тілтаным» журналы. 2017. №3


27 
При подготовке лингвистов-прикладников Аскар Кудайбергенович стремится 
не только обучать, передать свои знания, но и прививать им любовь и уважение к 
казахскому языку. Эти чувства и забота о родном языке передались ему по крови от 
отца Кудайбергена Куановича, первого профессора казахской лингвистики и лежат 
в основе его жизненной позиции.


Достарыңызбен бөлісу:
1   ...   8   9   10   11   12   13   14   15   ...   51




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет