Атты Халықаралық ғылыми-əдістемелік конференция материалдары

жүктеу/скачать 2,56 Mb.

Pdf көрінісі

бет	120/255
Дата	29.11.2022
өлшемі	2,56 Mb.
	#53403

1 ... 116 117 118 119 120 121 122 123 ... 255

Байланысты:
zhinak

Keywords: the Bashkir language, Turkic languages, dialectology, dialect, linguistic corpus,
corpus linguistics.
Изучение языковых особенностей диалектов и говоров на материале полевых записей,
представляет большую ценность не только для диалектологических исследований, но и для
смежных дисциплин, изучающих историю развития диалектов, историю взаимоотношений с
соседними народами, этнографию башкирского народа, географию и т. д.
Масштабное исследование башкирских диалектов началось в 20–30-е годы ХХ века.
Большой вклад в изучение диалектов внесли видные башкирские ученые Г. С. Амантаев,
Т. Г. Баишев, Г. Я. Давлетшин, З. Ш. Шакиров и др., которые в ходе многочисленных экспе-
диций выявили основные границы и черты говоров и диалектов языка.
В 50-е годы башкирская диалектология приступила к системному изучению фонети-
ки, лексики и морфологии говоров. Появление монографических трудов Т. Г. Баишева [1],
Дж. Г. Киекбаева [2] вывело башкирскую диалектологическую науку на всесоюзную тюрко-
логическую арену.
С 1960 года началось систематическое изучение диалектов, полевые материалы, собран-
ные во время экспедиций 60–70-х годов, заложили начало диалектной лексикографии [3-5],
легли в основу диссертационных и монографических исследований [6-9].
В 1973 г. башкирскими диалектологами была начата работа над Атласом диалектов баш-
кирского языка, который был завершен и издан в 2005 г. Материалы Атласа введены сотруд-
никами лабораториилингвистики и информационных технология ИИЯЛ в базу данных Ма-
шинного фонда башкирского языка [10].
К сожалению, с 80-х годов ХХ в. и по настоящее время башкирские говоры и диалек-
ты остаются в стороне от фронтальных полевых исследований. Количество экспедиций с
единой программой сбора полевого материала резко уменьшилось. Полевых материалов с
охватом широкого круга информантов по поло-возрастным и другим социальным группам
отсутствует. Большинство материалов прежних экспедиций не были оцифрованы, большая
часть утрачена.
За более чем 30 лет в говорах и диалектах, несомненно, произошли сдвиги и изменения,
которые требуют фиксации и научного анализа. Современная лингвистика выдвигает новые
подходы к исследованию говоров языка, способствующие более быстрой и объективной об-
работке языковых данных. Все это актуализирует задачу сбора и анализа полевых матери-
алов сегодняшнего дня на новых методологиях и подходах по говорам башкирского языка.
Одним из ведущих направлений современной лингвистики является корпусное исследо-
вание, объектом которого являются речевые материалы, реализованные в виде как письмен-
ных текстов, так и устных (фонетических) массивов данных. На сегодняшний день в мире

195
насчитывается более тысячи корпусов, их количество растет с каждым годом экспоненци-
ально. Успешно работают в этом направлении исследователи и в тюркологии, в частности,
заслуживающие внимания теоретические работы ведутся в казахском языкознании [11-13].
Сформированные идеи и подходы корпусной лингвистики применяются и к диалектоло-
гическим материалам, при составлении корпусов диалектов. Часть таких корпусов включена
в состав национальных корпусов, часть функционирует как самостоятельный корпус. К при-
меру, корпусы диалектов немецкого языка (подкорпусы Мангеймского проекта) охватывают
4 группы корпусов, посвященных разновидностям немецкого языка (Sprachvarietaten) на тер-
ритории Германии и за ее пределами [14].
В России известны корпусы ижимского говора коми языка [15], Саратовский корпус рус-
ских говоров [16], Мультимедийный корпус диалектных текстов Устьянского района Архан-
гельской области [17], диалектный подкорпус Национального корпуса русского языка [18] и
др.
Задача создания корпуса башкирских диалектов впервые поднимается в башкирской
лингвистической науке. В то же время у коллектива имеется большой научный задел по разра-
ботке лингвистических корпусов башкирского языка. На сегодняшний день в сети Интернет
функционируют корпусы прозы, публицистики и фольклора, снабженные экстралингвисти-
ческой и лингвистической (морфологической и семантической) системой разметок [19-21].
Для получения объективных результатов по диалектам и говорам башкирского языка не-
обходимо создание репрезентативного корпуса диалектных текстов, максимально охватыва-
ющий все говоры диалектов и содержащий богатую металигвистическую разметку представ-
ленного текста, как возраст, гендерная принадлежность, уровень образования, возраст, язык
общения, национальность информантов, разнообразие тем для беседы и т.д. В корпусе будет
представлена расшифровка звуковых файлов в виде траскрибированных текстов, их литера-
турный вариант и русский перевод диалектного текста.
На данном этапе работы сотрудники Лаборатории лингвистики и информационных тех-
нологий начали сбор и обработку речевого материала по восточному диалекту башкирского
языка. Рассматриваемый диалект включает 5 говоров: айский, сальютский, аргаяшский, ми-
асский, кизильский.
1) Для сбора полевых материалов выбрано 28 населенных пунктов Республики Башкор-
тостан, Челябинской, Свердловской и Курганской областей Российской Федерации. Выбра-
ны те населенные пункты, которые были в свое время определены в качестве опорных пун-
ктов для диалектологического атласа башкирского зыка.
2) По каждому населенному пункту производится запись минимум 12 информантов: 2
записи по половому признаку, 6 записей по возрастным группам. Выделяются следующие
возрастные группы:
– дошкольный и начальный класс (до 11 лет),
– средний школьный (от 11–15 лет),
– старший и студенческий возраст (16–25 лет),
– средний возраст (25–45 лет),
– старший возраст (45–65 лет),
– пожилой возраст (от 65 лет).
Учитывается образование информанта: начальное, среднее, высшее.
3) Аудиозапись сопровождается информацией, которая составляет экстралингвистиче-
скую разметку аудиофайла:
– пол: мужской, женский;
– образование: начальное, среднее (среднее школьное или суз), высшее;
– возраст;
– язык обучения: башкирский, русский, татарский, чувашский;

196
– язык общения в семье: башкирский, русский, татарский;
– национальность информанта;
– имя, отчество, фамилия;
– место последнего долгого проживания до переезда в данное место (в случае переезда);
– время проживания до последнего места проживания (в случае переезда);
– время записи.
4) Выделяется тип общения: монолог, диалог, полилог.
5) Для записи информантов определены следующие 15 тем:
– свадьба, свадебные обычаи;
– обычные блюда (что любят готовить на каждый день, что на праздниках);
– какой скот и как содержат;
– дети и близкие родственники (система родства);
– приусадебное хозяйство (огород, сад);
– о доме (когда построен, кто строил, крыша, рамы);
– топонимия в окрестностях поселения;
– история села, школы, рода;
– работа, школа, друзья;
– времена года, погода;
– частушки, пословицы, поговорки, сказки (какие знают);
– поездка в райцентр (по каким делам, каким транспортом пользуются);
– игры детей (какие игры и как играют);
– друзья детей (какие у детей друзья, где они живут);
– животный мир около поселения (какие птицы и звери обитают).
6) Запись осуществляется на цифровой диктофон в несжатом формате (.WAV, 16бит/22kHz
– 16бит/48kHz), при отсутствии посторонних звуков, хотя отдельными исследователями и
отмечается, что записи в потенциально шумных местах также представляют интерес, по-
скольку «они отражают разные коммуникативные ситуации» [22, с. 57]. Первичная обработ-
ка аудиозаписей (очистка от посторонних шумов и длительных пауз), паспортизация произ-
водится в программе Sound Forige.
7) Паспортизация файлов и экстралингвистическая разметка частично включается в име-
на аудиофайлов:
1. v – восточный диалект, aj – айский говор, ar – аргаяшский говор, sl – сальютский говор,
mi – миасский говор, kz – кизильский говор;
2. m – мужчина, w – женщина;
3. образование: n – начальное образование, s – среднее образование, v – высшее образование;
4. номер возрастной группы: 1 – дошкольный и начальный класс (до 11 лет), 2 – средний
школьный (от 11–15 лет), 3 – старший и студенческий возраст (16–25 лет), 4 – средний воз-
раст (25–45 лет), 5 – старший возраст (45–65 лет), 6 – пожилой возраст (от 65 лет);
5. t1 – t15 – темы;
Например, файл varwvt84d003 – означает принадлежность звукового файла восточному
диалекту, аргаяшскому говору, в котором осуществлена запись на тему “история села, школы,
рода” женщиной среднего возраста с высшим образованием.
Дополнительные коды информанта: от d001 до d999. Этот код является именем тексто-
вого файла, в котором указывается имя, фамилия, отчество, язык обучения, язык общения
в семье, национальность информанта, место последнего долгого проживания до переезда
в данное место (в случае переезда), время проживания до последнего места проживания (в
случае переезда), время проживания в данном месте, дата записи. Все данные разделяются
знаком @. Например: Зилда Ахмадиевна Мавлетова@б@б@б @Мишкино Учалинский рай-
он РБ@10@25@12.08.2017 – имя этого файла d005.txt

197
Следует отметить, что многие проблемы башкирской диалектологии до сих пор остаются
вне поля зрения языковедов, например, относительно слабо изучен диалектный синтаксис,
процесс взаимовлияния и взаимообогащения диалектов, требуют более детального изучения
говоры северо-западного диалекта. Ждут своей очереди проблемы исследования в сопоста-
вительном аспекте диалектных данных башкирского языка с тюркскими, финно-угорскими
и другими языками. Таким образом, создаваемый корпус будет включать в себя богатый ди-
алектный материал, что станет бесценным источником для последующих изысканий в обла-
сти фонетики, лексики и грамматики башкирских говоров и диалектов башкирского языка.

жүктеу/скачать 2,56 Mb.

Достарыңызбен бөлісу:

1 ... 116 117 118 119 120 121 122 123 ... 255