Атты Халықаралық ғылыми-əдістемелік конференция материалдары



Pdf көрінісі
бет153/343
Дата06.01.2022
өлшемі2,56 Mb.
#13292
1   ...   149   150   151   152   153   154   155   156   ...   343
Keywords: the Bashkir language, Turkic languages, dialectology, dialect, linguistic corpus, 

corpus linguistics.

Изучение языковых особенностей диалектов и говоров на материале полевых записей, 

представляет большую ценность не только для диалектологических исследований, но и для 

смежных дисциплин, изучающих историю развития диалектов, историю взаимоотношений с 

соседними народами, этнографию башкирского народа, географию и т. д.

Масштабное  исследование  башкирских  диалектов  началось  в  20–30-е  годы  ХХ  века. 

Большой  вклад  в  изучение  диалектов  внесли  видные  башкирские  ученые  Г.  С.  Амантаев, 

Т. Г. Баишев, Г. Я. Давлетшин, З. Ш. Шакиров и др., которые в ходе многочисленных экспе-

диций выявили основные границы и черты говоров и диалектов языка. 

В  50-е  годы  башкирская  диалектология  приступила  к  системному  изучению  фонети-

ки, лексики и морфологии говоров. Появление монографических трудов Т. Г. Баишева [1], 

Дж. Г. Киекбаева [2] вывело башкирскую диалектологическую науку на всесоюзную тюрко-

логическую арену.

С 1960 года началось систематическое изучение диалектов, полевые материалы, собран-

ные во время экспедиций 60–70-х годов, заложили начало диалектной лексикографии [3-5], 

легли в основу диссертационных и монографических исследований [6-9]. 

В 1973 г. башкирскими диалектологами была начата работа над Атласом диалектов баш-

кирского языка, который был завершен и издан в 2005 г. Материалы Атласа введены сотруд-

никами лабораториилингвистики и информационных технология ИИЯЛ в базу данных Ма-

шинного фонда башкирского языка [10].

К сожалению, с 80-х годов ХХ в. и по настоящее время башкирские говоры и диалек-

ты  остаются  в  стороне  от  фронтальных  полевых  исследований.  Количество  экспедиций  с 

единой программой сбора полевого материала резко уменьшилось. Полевых материалов с 

охватом широкого круга информантов по поло-возрастным и другим социальным группам 

отсутствует. Большинство материалов прежних экспедиций не были оцифрованы, большая 

часть утрачена. 

За более чем 30 лет в говорах и диалектах, несомненно, произошли сдвиги и изменения, 

которые требуют фиксации и научного анализа. Современная лингвистика выдвигает новые 

подходы к исследованию говоров языка, способствующие более быстрой и объективной об-

работке языковых данных. Все это актуализирует задачу сбора и анализа полевых матери-

алов сегодняшнего дня на новых методологиях и подходах по говорам башкирского языка. 

Одним из ведущих направлений современной лингвистики является корпусное исследо-

вание, объектом которого являются речевые материалы, реализованные в виде как письмен-

ных текстов, так и устных (фонетических) массивов данных. На сегодняшний день в мире 




195

насчитывается более тысячи корпусов, их количество растет с каждым годом экспоненци-

ально. Успешно работают в этом направлении исследователи и в тюркологии, в частности, 

заслуживающие внимания теоретические работы ведутся в казахском языкознании [11-13].

Сформированные идеи и подходы корпусной лингвистики применяются и к диалектоло-

гическим материалам, при составлении корпусов диалектов. Часть таких корпусов включена 

в состав национальных корпусов, часть функционирует как самостоятельный корпус. К при-

меру, корпусы диалектов немецкого языка (подкорпусы Мангеймского проекта) охватывают 

4 группы корпусов, посвященных разновидностям немецкого языка (Sprachvarietaten) на тер-

ритории Германии и за ее пределами [14]. 

В России известны корпусы ижимского говора коми языка [15], Саратовский корпус рус-

ских говоров [16], Мультимедийный корпус диалектных текстов Устьянского района Архан-

гельской области [17], диалектный подкорпус Национального корпуса русского языка [18] и 

др.


Задача  создания  корпуса  башкирских  диалектов  впервые  поднимается  в  башкирской 

лингвистической науке. В то же время у коллектива имеется большой научный задел по разра-

ботке лингвистических корпусов башкирского языка. На сегодняшний день в сети Интернет 

функционируют корпусы прозы, публицистики и фольклора, снабженные экстралингвисти-

ческой и лингвистической (морфологической и семантической) системой разметок [19-21].

Для получения объективных результатов по диалектам и говорам башкирского языка не-

обходимо создание репрезентативного корпуса диалектных текстов, максимально охватыва-

ющий все говоры диалектов и содержащий богатую металигвистическую разметку представ-

ленного текста, как возраст, гендерная принадлежность, уровень образования, возраст, язык 

общения, национальность информантов, разнообразие тем для беседы и т.д. В корпусе будет 

представлена расшифровка звуковых файлов в виде траскрибированных текстов, их литера-

турный вариант и русский перевод диалектного текста. 

На данном этапе работы сотрудники Лаборатории лингвистики и информационных тех-

нологий начали сбор и обработку речевого материала по восточному диалекту башкирского 

языка. Рассматриваемый диалект включает 5 говоров: айский, сальютский, аргаяшский, ми-

асский, кизильский. 

1) Для сбора полевых материалов выбрано 28 населенных пунктов Республики Башкор-

тостан, Челябинской, Свердловской и Курганской областей Российской Федерации. Выбра-

ны те населенные пункты, которые были в свое время определены в качестве опорных пун-

ктов для диалектологического атласа башкирского зыка. 

2) По каждому населенному пункту производится запись минимум 12 информантов: 2 

записи по половому признаку, 6 записей по возрастным группам. Выделяются следующие 

возрастные группы:

– дошкольный и начальный класс (до 11 лет), 

– средний школьный (от 11–15 лет), 

– старший и студенческий возраст (16–25 лет), 

– средний возраст (25–45 лет), 

– старший возраст (45–65 лет), 

– пожилой возраст (от 65 лет).

Учитывается образование информанта: начальное, среднее, высшее.

3)  Аудиозапись  сопровождается  информацией,  которая  составляет  экстралингвистиче-

скую разметку аудиофайла:

– пол: мужской, женский;

– образование: начальное, среднее (среднее школьное или суз), высшее;

– возраст;

– язык обучения: башкирский, русский, татарский, чувашский;




196

– язык общения в семье: башкирский, русский, татарский;

– национальность информанта;

– имя, отчество, фамилия;

– место последнего долгого проживания до переезда в данное место (в случае переезда);

– время проживания до последнего места проживания (в случае переезда);

– время записи.

4) Выделяется тип общения: монолог, диалог, полилог.

5) Для записи информантов определены следующие 15 тем:

– свадьба, свадебные обычаи;

– обычные блюда (что любят готовить на каждый день, что на праздниках);

– какой скот и как содержат;

– дети и близкие родственники (система родства);

– приусадебное хозяйство (огород, сад);

– о доме (когда построен, кто строил, крыша, рамы);

– топонимия в окрестностях поселения;

– история села, школы, рода;

– работа, школа, друзья;

– времена года, погода;

– частушки, пословицы, поговорки, сказки (какие знают);

– поездка в райцентр (по каким делам, каким транспортом пользуются);

– игры детей (какие игры и как играют);

– друзья детей (какие у детей друзья, где они живут);

– животный мир около поселения (какие птицы и звери обитают).

6) Запись осуществляется на цифровой диктофон в несжатом формате (.WAV, 16бит/22kHz 

–  16бит/48kHz),  при  отсутствии  посторонних  звуков,  хотя  отдельными  исследователями  и 

отмечается,  что  записи  в  потенциально  шумных  местах  также  представляют  интерес,  по-

скольку «они отражают разные коммуникативные ситуации» [22, с. 57]. Первичная обработ-

ка аудиозаписей (очистка от посторонних шумов и длительных пауз), паспортизация произ-

водится в программе Sound Forige. 

7) Паспортизация файлов и экстралингвистическая разметка частично включается в име-

на аудиофайлов: 

1. v – восточный диалект, aj – айский говор, ar – аргаяшский говор, sl – сальютский говор, 

mi – миасский говор, kz – кизильский говор;

2. m – мужчина, w – женщина;

3. образование: n – начальное образование, s – среднее образование, v – высшее образование;

4. номер возрастной группы: 1 – дошкольный и начальный класс (до 11 лет), 2 – средний 

школьный (от 11–15 лет), 3 – старший и студенческий возраст (16–25 лет), 4 – средний воз-

раст (25–45 лет), 5 – старший возраст (45–65 лет), 6 – пожилой возраст (от 65 лет);

5. t1 – t15 – темы;

Например, файл varwvt84d003 – означает принадлежность звукового файла восточному 

диалекту, аргаяшскому говору, в котором осуществлена запись на тему “история села, школы, 

рода” женщиной среднего возраста с высшим образованием

Дополнительные коды информанта: от d001 до d999. Этот код является именем тексто-

вого файла, в котором указывается имя, фамилия, отчество, язык обучения, язык общения 

в  семье,  национальность  информанта,  место  последнего  долгого  проживания  до  переезда 

в данное место (в случае переезда), время проживания до последнего места проживания (в 

случае переезда), время проживания в данном месте, дата записи. Все данные разделяются 

знаком @. Например: Зилда Ахмадиевна Мавлетова@б@б@б @Мишкино Учалинский рай-

он РБ@10@25@12.08.2017 – имя этого файла d005.txt




197

Следует отметить, что многие проблемы башкирской диалектологии до сих пор остаются 

вне поля зрения языковедов, например, относительно слабо изучен диалектный синтаксис, 

процесс взаимовлияния и взаимообогащения диалектов, требуют более детального изучения 

говоры северо-западного диалекта. Ждут своей очереди проблемы исследования в сопоста-

вительном аспекте диалектных данных башкирского языка с тюркскими, финно-угорскими 

и другими языками. Таким образом, создаваемый корпус будет включать в себя богатый ди-

алектный материал, что станет бесценным источником для последующих изысканий в обла-

сти фонетики, лексики и грамматики башкирских говоров и диалектов башкирского языка.



Достарыңызбен бөлісу:
1   ...   149   150   151   152   153   154   155   156   ...   343




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет