25
логическому содержанию в трех функциональных стилях казахского языка: худо-
жественный, публицистический, научный;
– определены типы опорных слов;
– изучены
функционально-смысловые типы абзаца в зависимости от положения
в тексте;
– составлены модели текстов разных функциональных стилей в виде лексико-
семантических формул.
Полученные результаты являются уникальным и ценным материалом, которые
в дальнейшем, безусловно, будут использованы в разработке национальной интел-
лектуальной информационной системы, таких как: автоматическое реферирование,
система автоматического сбора и классификации информации, контент анализа,
автоматического порождения текста и др.
Осознавая важность филологических компьютерных баз данных как в плане
источника для новых научно-теоретических изысканий, так и в плане автоматизи-
рованного справочника для широкого круга пользователей, Аскар Кудайбергенович
в 2003 г. выступает в периодической печати с призывом к филологам и специалистам
IT технологии объединить усилия в этой области. С этого момента А.К. Жубанов
свои знания, опыт и талант организатора науки переносит в область разработки
лингвистических баз данных казахского языка.
В лингвистике выделяются собственно лингвистические базы данных и полно-
текстовые базы. Собственно лингвистические базы содержат информациюо
лингвистических единицах различного рода: лексике, фонетике, морфологии,
например, Международный компьютерный архив современного английского
языка (International Computer Archive of Modern English – ICAME), базаданных рус-
ской терминологии «РОСТЕРМ» и др. Полнотекстовые базы содержат корпусы
текстов, например, «Британский нацональный корпус английского языка», самый
крупный в России «Национальный корпус русского языка», или «Компьютерный
корпус текстов русских газет конца XX века».
В русле собственно лингвистических баз данных автором была разработана
структура представления данных в лексикографической базе «Тiл – қазына». Лекси-
кографические базы данных представляют из
себя многоуровневую структуру,
хранящую всю необхидимую информацию, позволяющую производить различные
операции поиска, доступа к различным информационным ресурсам и выводить для
конечного пользователя в оптимальном для восприятии расположении компонентов
данных базы. Основная трудность при разработке лексикографических баз данных
заключается в том, что они создаются на базе изданных в печатной форме словарей.
Структуры таких традиционных лексикографических трудов сильно различаются
и не могут быть переложены напрямую в информационные базы. Автор изначально
отказался от подхода создания разных форматов хранения данных для словарей с
разными структурами. А.К. Жубановым были проанализированы все имеющиеся
в казахском языкознании словари и выработана единая структура хранения данных
в компьютерной лексикографической базе.
Сегодня «Тiл – қазына» включет: лексикографическую картотеку Института
языкознания им. А. Байтурсынова КН МОН РК, данные многотомного толково-
го словаря и всех прочих изданных словарей казахского языка. База данных снаб-
жена программной оболочкой, позволяющей проецировать данные на выходе в
интуитивно понятные формы толкового, синонимического, орфоэпического сло-
А.Байтұрсынұлы атындағы Тіл білімі институтының «Тілтаным» журналы. 2017. №3
26
варей, двуязычных общих и терминологических словарей, генеральной картотеки
Института язкознания им. А. Байтурсынова КН МОН РК. Например, в проекции
картотеки пользователь получает такие параметры слова как иллюстрационный
материал употребления слова с указанием автора, названия произведения, года
выпуска, места издания, абзаца и пр.
Данная база реализована как сетевая для научных сотрудников Института
языкознания и является ценным источником для многих лингвистических иссле-
дований и лексикографических разработок. Так на его базе был подготовлен в
сравнительно короткие сроки 15 томный толковый словарь казахского языка.
Отдавая много сил научно-исследовательской работе, Аскар Кудайбергенович
все же находит время и для разработки новых инновационных
методик в области
преподавания языка. Предложенные им методы оптимизации процесса обучения
казахскому языку, такие как учет наряду с частотой употребления слова и параметра
важности слова K (K= F·m/N·n) и созданные им программы автоматического его
подсчета, нашли широкое применение в
школах и вузах республики.
Результаты многолетних исследований ученого, его идеи и открытия легли
в основу разработки казахского национального корпуса, который создается в
Институте языкознания им. А. Байтурсынова под руководством самого автора.
Видение архитектуры национального корпуса, изложенное в его многочисленных
научных трудах, разработанные им подходы к решению задач автоматического
синтеза и
анализа казахской словоформы, созданная база данных «Тiл – қазына»
и его неустанная энергия и забота позволяют научному коллективу института, в
нелегкие для науки годы, успешно его реализовывать.
Аскар Кудайбергенович самый талантливый и яркий ученик Калдыбая
Бектаевича, которому учитель и основатель математической лингвистики
Казахстана передал в свое время руководство созданной им группой научных
сотрудников при Институте языкознания им. А. Байтурсынова КН МОН РК. За
прошедшие полвека группа стала лабораторией Автоматизации в лексикографии,
затем была возведена в
ранг отдела прикладной лингвистик. За эти годы
Аскар Кудайбергеновичне только развил школу математической лингвистики
К.Б.Бектаева, но и воспиталсвою школу, школу компьютерной лингвистики.
Он является научным руководителем и консультантом и оппонентом ряда канди-
датских и докторских диссертаций. Им подготовлены научные кадры не только
для казахской прикладной лингвистики, но и для башкирской. Автор этой статьи
проходил в 1983-1984 гг. стажировку под руководством А.К. Жубанова в группе
Автоматизации в лексикографии Института языкознания им. А. Байтурсынова
КН МОН РК. Аскар Кудайбергенович был в дальнейшем научным консультантом
моей кандидатской диссертации.
Темы, защищенных его учениками, диссертаций охватывают разнообразные
направления прикладной лингвистики. Это подтверждает энциклопедичность и
глубину его научных познаний в области математики, информатики и лингвистики.
С большинством своих учеников Аскар Кудайбергенович был знаком, когда они
учились в ВУЗе. Он читал и продолжает читать лекции, спецкурсы, проводит
практические занятия для студентов, магистрантов и РhD докторантов Казахского
национального университета им. аль-Фараби и Казахского Государственного
национального педагогического университета им. Абая по прикладной лингвистике
и по компьютерной лингвистике.
А.Байтұрсынұлы атындағы Тіл білімі институтының «Тілтаным» журналы. 2017. №3
27
При подготовке лингвистов-прикладников Аскар Кудайбергенович стремится
не только обучать, передать свои знания, но и прививать им любовь и уважение к
казахскому языку. Эти чувства и забота о родном языке передались ему по крови от
отца Кудайбергена Куановича, первого профессора казахской лингвистики и лежат
в
основе его жизненной позиции.
Достарыңызбен бөлісу: