23
научную деятельность в 60-х годах ХХ века с составления частотных словарей
и на их базе статистического изучения структуры казахского текста. В годы
начала проникновения вычислительных машин в
гуманитарные науки еще не
существовало специализированных программных пакетов и приложений как для
работы с текстами, так и для математического анализа результатов. Молодым
ученым был оцифрован роман М. Ауэзова «Абай жолы» и на основе разработанных
самим автором алгоритмов и программ проведено исследование материала на
ЭВМ «Минск-22». Результаты исследования были опубликованы в ряде научных
статей и легли в
основу кандидатской диссертации молодого ученого.
Аскаром Кудайбергеновичем на материале казахских текстов было подтверж-
дено высказанное предположение о том, что выбор нормировок (объем серии (K),
количество серий (n) и объем выборки (N)) в лингвистических исследованиях
существенно влияет на характер распределения изучаемой лингвистической
единицы.
В этих же исследованиях автором было показано, что при малых значениях
нормировок вид распределения лингвистических единиц (частей речи) зависит и
от функционального стиля исследуемых текстов. Так при K>25, n>100, N>2500
в художественных текстах и при K>50, n>100, N>5000 в
публицистических
текстах распределение прилагательных согласуется с законами Шарлье типа
А, В и Пуассона. Эти исследования позволили А.К. Жубанову и К.Б.Бектаеву
предложить единый подход в составлении частотных словарей и в проведении
статистико-квантитативного
анализа текстов тюркских языков (с нормировкой
K=200, n=1000, N=200000).
Отметим, на заре информационных технологий, когда не было ОС Windows,
а существующие операционные системы в СССР поддерживали только англий-
ский и русский языки, когда еще не было самого слова компьютер, а вместо него
использовалась аббревиатура ЭВМ, применение цифровой техники в лингвис-
тических исследованиях для большинства языков Советского Союза являлось
нетривиальной задачей. Пионерские работы А.К.Жубанова, посвященные проблеме
кодирования для ЭВМ письменных текстов тюркских языков, составленные им
алгоритмы реализации частотных, обратно-частотных, алфавитно-частотных
словарей, частотных списков сочетаемости букв, буквосочетания, словосочетаний
открыли возможность применения цифровой техники в тюркологии.
Предложенная автором технология обработки тюркских текстов цифровой
техникой была успешно применена в работах узбекских, каракалпакских и баш-
кирских языковедов.
Следует отметить, что Аскар Кудайбергенович многие годы оказывал советами
постоянную поддержку коллегам-языковедам из тюркских республик в освоении
информационной технологии. Это отразилось, в частности, в том, что официально
принятые кириллические раскладки национальных клавиатур компьютеров
многих тюркских языков оказались подобными казахской.
Большинство частотных словарей по казахскому языку были реализованы при
непосредственном участии А.К. Жубанова. Эти словари не только явились ценным
исследовательским материалом, но и высоко подняли престиж всей казахстанской
лингвистической науки. Так, частотный словарь языка поэзии Абая был в СССР
вторым словарем такого типа после словаря лирики Пушкина, а словари по
А.Байтұрсынұлы атындағы Тіл білімі институтының «Тілтаным» журналы. 2017. №3
24
текстам орхонской письменности и исторического памятника «Кодекс Куманикус»
явились вообще уникальными словарями такого типа в мировом масштабе. Это
направление научной деятельности и сегодня остается в поле зрения ученого. Так,
Аскаром Кудайбергеновичем с коллегами подготовлен большой сводный частот-
ный словарь казахского языка, который должен увидеть свет в этом году.
Созданные ученым частотные словари, разработанная им
методика статистичес-
кого анализа текста, были блестяще использованы Аскаром Кудайбергеновичем в
изучении авторской лексикографии и выявлении индивидуального стиля казахских
писателей. Ряд работ автора посвящены изучению графемной структуры казахско-
го текста. Ученым выявлена высокая частота употребления сонорных и смычно-
взрывных звуков в казахской речи, определены возможности различных типов
гласных и согласных графем дифференцировать функциональные стили. Работы
в
этом направлении привели ученого к решению проблемы автоматического
транскрибирования казахских текстов. А.К.Жубановым был предложен алгоритм
автоматического преобразования письменных текстов в фонетический текст.
Накопленный автором статистический материал по словоизменительным и фор-
мообразовательным категориям казахского текста позволили ученому приступить
к разработке теоретических аспектов проблемы автоматического синтеза казахской
словоформы. Отметим, что решение хотя бы одной задачи из
связки синтез-
анализ, позволяет, в принципе, решить и вторую. Проблемы синтеза и анализа
словоформы являются базовыми в создании автоматического морфологического
анализатора языка, который открывает путь к реализации интеллектуальных
систем с общением на естественном языке. К сожалению, отсутствие тесных
научных связей в начале 2000-х годов не позволило скоординировать подходы тюр-
кологов к данной проблеме. Подход А.К. Жубанова к решению
проблемы на основе
Достарыңызбен бөлісу: