Образовательная программа «Прикладная, экспериментальная и математическая лингвистика»



бет20/28
Дата14.05.2023
өлшемі1,12 Mb.
#92943
түріОбразовательная программа
1   ...   16   17   18   19   20   21   22   23   ...   28

Выводы


По результатам проведенного эксперимента можно говорить о том, что метод КАП может с успехом применяться на материале русского языка. Тем не менее, следует сделать несколько замечаний о его возможной модификации.
Во-первых, для русского языка необходимо указывать в паттерне морфосинтаксическую информацию. Иначе, например, паттерн [[Human]] заменяет [[Inanimate]] можно понимать и как «человек заменяет некий предмет», и как «человек заменяет собой некий предмет». Сложным остается вопрос о том, как предоставлять подобные комментарии. Возможно несколько вариантов: указать падеж, задать вопрос или написать пояснение ко всему паттерну. По-видимому, выбор варианта зависит от цели описания. Для понимания человеком удобнее всего будет третий вариант, поскольку даже указание падежа или вопроса не всегда сделает значение паттерна очевидным. Однако не обязательно указывать морфосинтаксические характеристики для каждого элемента паттерна. Во многих случаях они будут излишними, поскольку необходимая информация уже содержится в предлогах.
Во-вторых, нам встретилось несколько паттернов, где слот может занять языковая единица практически любого семантического типа. Самые яркие примеры можно привести для глаголов говорить и кричать: говорить и кричать можно обо всем. Мы решили, что для таких случаев было бы удобно ввести некое обозначение. В выделенных нами паттернах мы использовали символ #.
В-третьих, как мы уже упоминали выше, во многих случаях возникла необходимость сузить семантический тип. Если в некоторых паттернах его можно просто заменить языковой единицей, например, бросать взгляд, бросать жребий, то в других случаях так просто не получалось. Так, в разделе 3.3 уже был приведен пример про семантический тип [[Food]], который в сочетании с глаголом подниматься реализуется только определённым кругом слов: тесто, опара, дрожжи. В подобных случаях мы писали [[Food]](тесто!).

Заключение


В ходе данной работы мы провели анализ существующих на данный момент словарей валентности для трёх языков. Как один из возможных способов описания, нами был выбран метод анализа корпусного материала, используемый в «Словаре паттернов английских глаголов». Данный метод, корпусный анализ паттернов, основывается на теории норм и эксплуатаций, основные положения и понятия которой представлены во второй части работы.
Основной целью практической части нашего исследования была адаптация метода корпусного анализа паттернов для русского языка. Для этого мы создали пробную версию словаря для 16 глаголов с применением исследуемого метода. В ходе создания нашего словаря мы решили несколько практических проблем, в т.ч. выбрали корпус и способ разметки, определили оптимальный размер выборки. Полученные паттерны мы проанализировали в 2 аспектах: сравнение с размеченной выборкой из другого корпуса и с существующими словарями русского языка. В первом случае мы определили, что в среднем выделенные паттерны охватывают более 90-95% случайной корпусной выборки. Для второй задачи мы провели сопоставительный анализ 4 толковых словарей русского языка: толковый словарь русского языка под ред. Д.Н. Ушакова, словарь русского языка С.И. Ожегова, толковый словарь русского языка под ред. А.П. Евгеньевой и Большой толковый словарь русского языка под ред. С.А. Кузнецова. В результате оказалось, что для всех глаголов полученные паттерны покрывают значения, общие для всех словарей, а в половине случаев – и все словарные значения. С нашей точки зрения, данные результаты доказывают как и эффективность использованного метода применительно к материалу русского языка, так и то, что выбранного размера корпуса достаточно для выделения паттернов.
Более того, мы сделали несколько выводов относительно изменения метода корпусного анализа паттернов для русского языка, основываясь на проведенной работе. Наши замечания касаются как и способа описания, так и самого метода. Мы добавили несколько дополнительных обозначений для представления паттернов в более понятном и компактном виде. Также, с нашей точки зрения, определённые паттерны для русского языка не могут описываться без упоминания морфосинтаксических характеристик. Все предложенные изменения учитывались нами при описании полученных паттернов.
В дальнейшем мы видим несколько путей развития данного исследования. Естественно, можно продолжать работу над созданием словаря. Однако мы считаем, что это трудоемкий процесс, который займет слишком много времени, если продолжать работу вручную. Полезнее всего будет разработка способов автоматизации корпусного анализа паттернов. Во второй главе мы упомянули несколько работ, посвященных этой теме, но на материале английского языка. Мы предполагаем, что автоматизировать можно этап выделения паттернов, но в этом направлении возникает проблема нехватки семантически размеченного корпуса. Поэтому, по-видимому, перед проведением каких-либо экспериментов по автоматическому выделению паттернов необходимо разметить корпус семантическими типами, желательно, также не вручную.


Достарыңызбен бөлісу:
1   ...   16   17   18   19   20   21   22   23   ...   28




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет