Атты Халықаралық ғылыми-əдістемелік конференция материалдары

жүктеу/скачать 2,56 Mb.

Pdf көрінісі

бет	153/343
Дата	06.01.2022
өлшемі	2,56 Mb.
	#13292

1 ... 149 150 151 152 153 154 155 156 ... 343

Байланысты:
Н.Оралбай-конф.материалдары

Keywords: the Bashkir language, Turkic languages, dialectology, dialect, linguistic corpus,

corpus linguistics.

Изучение языковых особенностей диалектов и говоров на материале полевых записей,

представляет большую ценность не только для диалектологических исследований, но и для

смежных дисциплин, изучающих историю развития диалектов, историю взаимоотношений с

соседними народами, этнографию башкирского народа, географию и т. д.

Масштабное исследование башкирских диалектов началось в 20–30-е годы ХХ века.

Большой вклад в изучение диалектов внесли видные башкирские ученые Г. С. Амантаев,

Т. Г. Баишев, Г. Я. Давлетшин, З. Ш. Шакиров и др., которые в ходе многочисленных экспе-

диций выявили основные границы и черты говоров и диалектов языка.

В 50-е годы башкирская диалектология приступила к системному изучению фонети-

ки, лексики и морфологии говоров. Появление монографических трудов Т. Г. Баишева [1],

Дж. Г. Киекбаева [2] вывело башкирскую диалектологическую науку на всесоюзную тюрко-

логическую арену.

С 1960 года началось систематическое изучение диалектов, полевые материалы, собран-

ные во время экспедиций 60–70-х годов, заложили начало диалектной лексикографии [3-5],

легли в основу диссертационных и монографических исследований [6-9].

В 1973 г. башкирскими диалектологами была начата работа над Атласом диалектов баш-

кирского языка, который был завершен и издан в 2005 г. Материалы Атласа введены сотруд-

никами лабораториилингвистики и информационных технология ИИЯЛ в базу данных Ма-

шинного фонда башкирского языка [10].

К сожалению, с 80-х годов ХХ в. и по настоящее время башкирские говоры и диалек-

ты остаются в стороне от фронтальных полевых исследований. Количество экспедиций с

единой программой сбора полевого материала резко уменьшилось. Полевых материалов с

охватом широкого круга информантов по поло-возрастным и другим социальным группам

отсутствует. Большинство материалов прежних экспедиций не были оцифрованы, большая

часть утрачена.

За более чем 30 лет в говорах и диалектах, несомненно, произошли сдвиги и изменения,

которые требуют фиксации и научного анализа. Современная лингвистика выдвигает новые

подходы к исследованию говоров языка, способствующие более быстрой и объективной об-

работке языковых данных. Все это актуализирует задачу сбора и анализа полевых матери-

алов сегодняшнего дня на новых методологиях и подходах по говорам башкирского языка.

Одним из ведущих направлений современной лингвистики является корпусное исследо-

вание, объектом которого являются речевые материалы, реализованные в виде как письмен-

ных текстов, так и устных (фонетических) массивов данных. На сегодняшний день в мире

195

насчитывается более тысячи корпусов, их количество растет с каждым годом экспоненци-

ально. Успешно работают в этом направлении исследователи и в тюркологии, в частности,

заслуживающие внимания теоретические работы ведутся в казахском языкознании [11-13].

Сформированные идеи и подходы корпусной лингвистики применяются и к диалектоло-

гическим материалам, при составлении корпусов диалектов. Часть таких корпусов включена

в состав национальных корпусов, часть функционирует как самостоятельный корпус. К при-

меру, корпусы диалектов немецкого языка (подкорпусы Мангеймского проекта) охватывают

4 группы корпусов, посвященных разновидностям немецкого языка (Sprachvarietaten) на тер-

ритории Германии и за ее пределами [14].

В России известны корпусы ижимского говора коми языка [15], Саратовский корпус рус-

ских говоров [16], Мультимедийный корпус диалектных текстов Устьянского района Архан-

гельской области [17], диалектный подкорпус Национального корпуса русского языка [18] и

др.

Задача создания корпуса башкирских диалектов впервые поднимается в башкирской

лингвистической науке. В то же время у коллектива имеется большой научный задел по разра-

ботке лингвистических корпусов башкирского языка. На сегодняшний день в сети Интернет

функционируют корпусы прозы, публицистики и фольклора, снабженные экстралингвисти-

ческой и лингвистической (морфологической и семантической) системой разметок [19-21].

Для получения объективных результатов по диалектам и говорам башкирского языка не-

обходимо создание репрезентативного корпуса диалектных текстов, максимально охватыва-

ющий все говоры диалектов и содержащий богатую металигвистическую разметку представ-

ленного текста, как возраст, гендерная принадлежность, уровень образования, возраст, язык

общения, национальность информантов, разнообразие тем для беседы и т.д. В корпусе будет

представлена расшифровка звуковых файлов в виде траскрибированных текстов, их литера-

турный вариант и русский перевод диалектного текста.

На данном этапе работы сотрудники Лаборатории лингвистики и информационных тех-

нологий начали сбор и обработку речевого материала по восточному диалекту башкирского

языка. Рассматриваемый диалект включает 5 говоров: айский, сальютский, аргаяшский, ми-

асский, кизильский.

1) Для сбора полевых материалов выбрано 28 населенных пунктов Республики Башкор-

тостан, Челябинской, Свердловской и Курганской областей Российской Федерации. Выбра-

ны те населенные пункты, которые были в свое время определены в качестве опорных пун-

ктов для диалектологического атласа башкирского зыка.

2) По каждому населенному пункту производится запись минимум 12 информантов: 2

записи по половому признаку, 6 записей по возрастным группам. Выделяются следующие

возрастные группы:

– дошкольный и начальный класс (до 11 лет),

– средний школьный (от 11–15 лет),

– старший и студенческий возраст (16–25 лет),

– средний возраст (25–45 лет),

– старший возраст (45–65 лет),

– пожилой возраст (от 65 лет).

Учитывается образование информанта: начальное, среднее, высшее.

3) Аудиозапись сопровождается информацией, которая составляет экстралингвистиче-

скую разметку аудиофайла:

– пол: мужской, женский;

– образование: начальное, среднее (среднее школьное или суз), высшее;

– возраст;

– язык обучения: башкирский, русский, татарский, чувашский;

196

– язык общения в семье: башкирский, русский, татарский;

– национальность информанта;

– имя, отчество, фамилия;

– место последнего долгого проживания до переезда в данное место (в случае переезда);

– время проживания до последнего места проживания (в случае переезда);

– время записи.

4) Выделяется тип общения: монолог, диалог, полилог.

5) Для записи информантов определены следующие 15 тем:

– свадьба, свадебные обычаи;

– обычные блюда (что любят готовить на каждый день, что на праздниках);

– какой скот и как содержат;

– дети и близкие родственники (система родства);

– приусадебное хозяйство (огород, сад);

– о доме (когда построен, кто строил, крыша, рамы);

– топонимия в окрестностях поселения;

– история села, школы, рода;

– работа, школа, друзья;

– времена года, погода;

– частушки, пословицы, поговорки, сказки (какие знают);

– поездка в райцентр (по каким делам, каким транспортом пользуются);

– игры детей (какие игры и как играют);

– друзья детей (какие у детей друзья, где они живут);

– животный мир около поселения (какие птицы и звери обитают).

6) Запись осуществляется на цифровой диктофон в несжатом формате (.WAV, 16бит/22kHz

– 16бит/48kHz), при отсутствии посторонних звуков, хотя отдельными исследователями и

отмечается, что записи в потенциально шумных местах также представляют интерес, по-

скольку «они отражают разные коммуникативные ситуации» [22, с. 57]. Первичная обработ-

ка аудиозаписей (очистка от посторонних шумов и длительных пауз), паспортизация произ-

водится в программе Sound Forige.

7) Паспортизация файлов и экстралингвистическая разметка частично включается в име-

на аудиофайлов:

1. v – восточный диалект, aj – айский говор, ar – аргаяшский говор, sl – сальютский говор,

mi – миасский говор, kz – кизильский говор;

2. m – мужчина, w – женщина;

3. образование: n – начальное образование, s – среднее образование, v – высшее образование;

4. номер возрастной группы: 1 – дошкольный и начальный класс (до 11 лет), 2 – средний

школьный (от 11–15 лет), 3 – старший и студенческий возраст (16–25 лет), 4 – средний воз-

раст (25–45 лет), 5 – старший возраст (45–65 лет), 6 – пожилой возраст (от 65 лет);

5. t1 – t15 – темы;

Например, файл varwvt84d003 – означает принадлежность звукового файла восточному

диалекту, аргаяшскому говору, в котором осуществлена запись на тему “история села, школы,

рода” женщиной среднего возраста с высшим образованием.

Дополнительные коды информанта: от d001 до d999. Этот код является именем тексто-

вого файла, в котором указывается имя, фамилия, отчество, язык обучения, язык общения

в семье, национальность информанта, место последнего долгого проживания до переезда

в данное место (в случае переезда), время проживания до последнего места проживания (в

случае переезда), время проживания в данном месте, дата записи. Все данные разделяются

знаком @. Например: Зилда Ахмадиевна Мавлетова@б@б@б @Мишкино Учалинский рай-

он РБ@10@25@12.08.2017 – имя этого файла d005.txt

197

Следует отметить, что многие проблемы башкирской диалектологии до сих пор остаются

вне поля зрения языковедов, например, относительно слабо изучен диалектный синтаксис,

процесс взаимовлияния и взаимообогащения диалектов, требуют более детального изучения

говоры северо-западного диалекта. Ждут своей очереди проблемы исследования в сопоста-

вительном аспекте диалектных данных башкирского языка с тюркскими, финно-угорскими

и другими языками. Таким образом, создаваемый корпус будет включать в себя богатый ди-

алектный материал, что станет бесценным источником для последующих изысканий в обла-

сти фонетики, лексики и грамматики башкирских говоров и диалектов башкирского языка.

жүктеу/скачать 2,56 Mb.

Достарыңызбен бөлісу:

1 ... 149 150 151 152 153 154 155 156 ... 343