Атты Халықаралық ғылыми-əдістемелік конференция материалдары



Pdf көрінісі
бет120/255
Дата29.11.2022
өлшемі2,56 Mb.
#53403
1   ...   116   117   118   119   120   121   122   123   ...   255
Байланысты:
zhinak

Keywords: the Bashkir language, Turkic languages, dialectology, dialect, linguistic corpus, 
corpus linguistics.
Изучение языковых особенностей диалектов и говоров на материале полевых записей, 
представляет большую ценность не только для диалектологических исследований, но и для 
смежных дисциплин, изучающих историю развития диалектов, историю взаимоотношений с 
соседними народами, этнографию башкирского народа, географию и т. д.
Масштабное исследование башкирских диалектов началось в 20–30-е годы ХХ века. 
Большой вклад в изучение диалектов внесли видные башкирские ученые Г. С. Амантаев, 
Т. Г. Баишев, Г. Я. Давлетшин, З. Ш. Шакиров и др., которые в ходе многочисленных экспе-
диций выявили основные границы и черты говоров и диалектов языка. 
В 50-е годы башкирская диалектология приступила к системному изучению фонети-
ки, лексики и морфологии говоров. Появление монографических трудов Т. Г. Баишева [1], 
Дж. Г. Киекбаева [2] вывело башкирскую диалектологическую науку на всесоюзную тюрко-
логическую арену.
С 1960 года началось систематическое изучение диалектов, полевые материалы, собран-
ные во время экспедиций 60–70-х годов, заложили начало диалектной лексикографии [3-5], 
легли в основу диссертационных и монографических исследований [6-9]. 
В 1973 г. башкирскими диалектологами была начата работа над Атласом диалектов баш-
кирского языка, который был завершен и издан в 2005 г. Материалы Атласа введены сотруд-
никами лабораториилингвистики и информационных технология ИИЯЛ в базу данных Ма-
шинного фонда башкирского языка [10].
К сожалению, с 80-х годов ХХ в. и по настоящее время башкирские говоры и диалек-
ты остаются в стороне от фронтальных полевых исследований. Количество экспедиций с 
единой программой сбора полевого материала резко уменьшилось. Полевых материалов с 
охватом широкого круга информантов по поло-возрастным и другим социальным группам 
отсутствует. Большинство материалов прежних экспедиций не были оцифрованы, большая 
часть утрачена. 
За более чем 30 лет в говорах и диалектах, несомненно, произошли сдвиги и изменения, 
которые требуют фиксации и научного анализа. Современная лингвистика выдвигает новые 
подходы к исследованию говоров языка, способствующие более быстрой и объективной об-
работке языковых данных. Все это актуализирует задачу сбора и анализа полевых матери-
алов сегодняшнего дня на новых методологиях и подходах по говорам башкирского языка. 
Одним из ведущих направлений современной лингвистики является корпусное исследо-
вание, объектом которого являются речевые материалы, реализованные в виде как письмен-
ных текстов, так и устных (фонетических) массивов данных. На сегодняшний день в мире 


195
насчитывается более тысячи корпусов, их количество растет с каждым годом экспоненци-
ально. Успешно работают в этом направлении исследователи и в тюркологии, в частности, 
заслуживающие внимания теоретические работы ведутся в казахском языкознании [11-13].
Сформированные идеи и подходы корпусной лингвистики применяются и к диалектоло-
гическим материалам, при составлении корпусов диалектов. Часть таких корпусов включена 
в состав национальных корпусов, часть функционирует как самостоятельный корпус. К при-
меру, корпусы диалектов немецкого языка (подкорпусы Мангеймского проекта) охватывают 
4 группы корпусов, посвященных разновидностям немецкого языка (Sprachvarietaten) на тер-
ритории Германии и за ее пределами [14]. 
В России известны корпусы ижимского говора коми языка [15], Саратовский корпус рус-
ских говоров [16], Мультимедийный корпус диалектных текстов Устьянского района Архан-
гельской области [17], диалектный подкорпус Национального корпуса русского языка [18] и 
др.
Задача создания корпуса башкирских диалектов впервые поднимается в башкирской 
лингвистической науке. В то же время у коллектива имеется большой научный задел по разра-
ботке лингвистических корпусов башкирского языка. На сегодняшний день в сети Интернет 
функционируют корпусы прозы, публицистики и фольклора, снабженные экстралингвисти-
ческой и лингвистической (морфологической и семантической) системой разметок [19-21].
Для получения объективных результатов по диалектам и говорам башкирского языка не-
обходимо создание репрезентативного корпуса диалектных текстов, максимально охватыва-
ющий все говоры диалектов и содержащий богатую металигвистическую разметку представ-
ленного текста, как возраст, гендерная принадлежность, уровень образования, возраст, язык 
общения, национальность информантов, разнообразие тем для беседы и т.д. В корпусе будет 
представлена расшифровка звуковых файлов в виде траскрибированных текстов, их литера-
турный вариант и русский перевод диалектного текста. 
На данном этапе работы сотрудники Лаборатории лингвистики и информационных тех-
нологий начали сбор и обработку речевого материала по восточному диалекту башкирского 
языка. Рассматриваемый диалект включает 5 говоров: айский, сальютский, аргаяшский, ми-
асский, кизильский. 
1) Для сбора полевых материалов выбрано 28 населенных пунктов Республики Башкор-
тостан, Челябинской, Свердловской и Курганской областей Российской Федерации. Выбра-
ны те населенные пункты, которые были в свое время определены в качестве опорных пун-
ктов для диалектологического атласа башкирского зыка. 
2) По каждому населенному пункту производится запись минимум 12 информантов: 2 
записи по половому признаку, 6 записей по возрастным группам. Выделяются следующие 
возрастные группы:
– дошкольный и начальный класс (до 11 лет), 
– средний школьный (от 11–15 лет), 
– старший и студенческий возраст (16–25 лет), 
– средний возраст (25–45 лет), 
– старший возраст (45–65 лет), 
– пожилой возраст (от 65 лет).
Учитывается образование информанта: начальное, среднее, высшее.
3) Аудиозапись сопровождается информацией, которая составляет экстралингвистиче-
скую разметку аудиофайла:
– пол: мужской, женский;
– образование: начальное, среднее (среднее школьное или суз), высшее;
– возраст;
– язык обучения: башкирский, русский, татарский, чувашский;


196
– язык общения в семье: башкирский, русский, татарский;
– национальность информанта;
– имя, отчество, фамилия;
– место последнего долгого проживания до переезда в данное место (в случае переезда);
– время проживания до последнего места проживания (в случае переезда);
– время записи.
4) Выделяется тип общения: монолог, диалог, полилог.
5) Для записи информантов определены следующие 15 тем:
– свадьба, свадебные обычаи;
– обычные блюда (что любят готовить на каждый день, что на праздниках);
– какой скот и как содержат;
– дети и близкие родственники (система родства);
– приусадебное хозяйство (огород, сад);
– о доме (когда построен, кто строил, крыша, рамы);
– топонимия в окрестностях поселения;
– история села, школы, рода;
– работа, школа, друзья;
– времена года, погода;
– частушки, пословицы, поговорки, сказки (какие знают);
– поездка в райцентр (по каким делам, каким транспортом пользуются);
– игры детей (какие игры и как играют);
– друзья детей (какие у детей друзья, где они живут);
– животный мир около поселения (какие птицы и звери обитают).
6) Запись осуществляется на цифровой диктофон в несжатом формате (.WAV, 16бит/22kHz 
– 16бит/48kHz), при отсутствии посторонних звуков, хотя отдельными исследователями и 
отмечается, что записи в потенциально шумных местах также представляют интерес, по-
скольку «они отражают разные коммуникативные ситуации» [22, с. 57]. Первичная обработ-
ка аудиозаписей (очистка от посторонних шумов и длительных пауз), паспортизация произ-
водится в программе Sound Forige
7) Паспортизация файлов и экстралингвистическая разметка частично включается в име-
на аудиофайлов: 
1. v – восточный диалект, aj – айский говор, ar – аргаяшский говор, sl – сальютский говор, 
mi – миасский говор, kz – кизильский говор;
2. m – мужчина, w – женщина;
3. образование: n – начальное образование, s – среднее образование, v – высшее образование;
4. номер возрастной группы: 1 – дошкольный и начальный класс (до 11 лет), 2 – средний 
школьный (от 11–15 лет), 3 – старший и студенческий возраст (16–25 лет), 4 – средний воз-
раст (25–45 лет), 5 – старший возраст (45–65 лет), 6 – пожилой возраст (от 65 лет);
5. t1 – t15 – темы;
Например, файл varwvt84d003 – означает принадлежность звукового файла восточному 
диалекту, аргаяшскому говору, в котором осуществлена запись на тему “история села, школы, 
рода” женщиной среднего возраста с высшим образованием. 
Дополнительные коды информанта: от d001 до d999. Этот код является именем тексто-
вого файла, в котором указывается имя, фамилия, отчество, язык обучения, язык общения 
в семье, национальность информанта, место последнего долгого проживания до переезда 
в данное место (в случае переезда), время проживания до последнего места проживания (в 
случае переезда), время проживания в данном месте, дата записи. Все данные разделяются 
знаком @. Например: Зилда Ахмадиевна Мавлетова@б@б@б @Мишкино Учалинский рай-
он РБ@10@25@12.08.2017 – имя этого файла d005.txt


197
Следует отметить, что многие проблемы башкирской диалектологии до сих пор остаются 
вне поля зрения языковедов, например, относительно слабо изучен диалектный синтаксис, 
процесс взаимовлияния и взаимообогащения диалектов, требуют более детального изучения 
говоры северо-западного диалекта. Ждут своей очереди проблемы исследования в сопоста-
вительном аспекте диалектных данных башкирского языка с тюркскими, финно-угорскими 
и другими языками. Таким образом, создаваемый корпус будет включать в себя богатый ди-
алектный материал, что станет бесценным источником для последующих изысканий в обла-
сти фонетики, лексики и грамматики башкирских говоров и диалектов башкирского языка.


Достарыңызбен бөлісу:
1   ...   116   117   118   119   120   121   122   123   ...   255




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет