Образовательная программа «Прикладная, экспериментальная и математическая лингвистика»


Результаты сопоставления значений



бет19/28
Дата14.05.2023
өлшемі1,12 Mb.
#92943
түріОбразовательная программа
1   ...   15   16   17   18   19   20   21   22   ...   28
Результаты сопоставления значений




Суммарное количество

Ушаков

Ожегов

Евгеньева

Кузнецов

Общее для 4 словарей

паттерны

говорить

15

14

9

8

9

7

8

расти

9

8

8

9

9

8

9

следить

8

7

5

6

6

4

4

зарабатывать

3

2

2

2

2

1

3

владеть

9

5

4

6

7

4

7

доверять

3

3

2

2

3

2

2

подниматься

23

10

10

18

14

3

15

дышать

8

4

5

5

7

2

5

кричать

7

4

4

5

6

3

5

бросать

19

14

7

13

13

4

11

заменять

3

3

3

3

3

3

3

выживать

6

3

3

6

5

2

2

рожать

4

3

3

4

4

2

3

драться

5

4

3

5

5

2

5

накрывать

4

3

4

4

4

3

3

пилить

5

3

2

4

4

1

5

На рис. 3.7 наглядно представлены те же данные: общее количество значений, количество для трех словарей и число значений, совпадающих с паттернами. Для нас важно то, что для всех глаголов количество паттернов равно или превышает количество значений, общих для всех словарей. Тем не менее, именно значения, общие для всех словарей, представляют глагол с объективной точки зрения. Различия между словарями – субъективны, зависят от их авторов.



Рис. 3.7. Соотношение выделенных значений для трех словарей и паттернов.
Однако количество паттернов, выделенных нами, превышает число общих словарных значений почти в 2 раза во многих случаях. Мы предполагаем, что это связано с тем, что по корпусным данным выделяются более тонкие различия между значениями и оттенками значений, опирающиеся на их валентностные характеристики. Также в список паттернов вошли частотные авторские эксплуатации и некоторые устойчивые выражения, которые, по всей видимости, не были включены в толковые словари.
    1. Классификация паттернов


Паттерны, выделенные нами по корпусному материалу, не все подходят для словарной статьи. В список паттернов кроме нормативных употреблений вошли эксплуатации, авторские и устоявшиеся, эллиптические конструкции, упоминания, и даже встретились очевидные случаи неосознанного ошибочного употребления. Поэтому возникло необходимость классифицировать полученные паттерны, отделив при этом кандидатов для словарной статьи. Мы распределили полученные паттерны на 7 категорий: первичные и вторичные нормативные употребления, эксплуатации, эллиптические конструкции, устойчивые выражения, упоминания и ошибки. Результаты представлены в табл. 3. 9.m В словарь войдут только 3 категории: первичные и вторичные нормы, устойчивые выражения.

Табл. 3.9.
Количественные характеристики классификации




Первичные нормы

Вторичные нормы

Эксплуатации

Эллипсис

Устойчивые выражения

Упоминания

Ошибки

говорить

10

5

-

2

3

-

1

расти

3

7

2

1

2

-

-

следить

5

11

-

2

3

1

2

зарабатывать

5

4

-

-

1

-

-

владеть

3

4

3

1

6

-

-

доверять

4

6

5

2

-

-

-

подниматься

11

12

8

-

3

-

-

дышать

3

3

7

4

3

1

-

кричать

8

6

6

-

-

-

1

бросать

1

11

7

1

9

-

-

заменять

11

2

3

3

-

1

-

выживать

4

1

4

-

1

-

-

рожать

3

2

3

-

-

-

-

драться

7

3

3

-

-

-

-

накрывать

5

5

1

2

1

-

-

пилить

5

5

1

1

1

-

-

В целом, процесс классификации является самой субъективной частью метода КАП и, по-видимому, не подлежит автоматизации. Тем не менее, мы выделили несколько закономерностей, которые облегчают процесс принятия решения о включении паттерна в определённую категорию.



  1. Частотность

Паттерны с частотой, равной 1, с большой вероятностью являются авторскими эксплуатациями. Это правило работает эффективнее всего при определении того, является ли паттерн вторичной нормой или авторской эксплуатацией.

  1. Семантический тип субъекта

Если субъект действия не имеет семантического типа из класса [[Physical_Object]], то, скорее всего, данный паттерн не является первичной нормой. Эта закономерность важна при выборе между первичной и вторичной нормой.

  1. Элементы паттерна

Если паттерн не полностью состоит из семантических типов, а включает в себя языковые единицы (помимо предлогов и союзов), то он, вероятно, входит в категорию устойчивых выражений.
Для наглядности разберём классификацию на примере глагола пилить (рис. 3.8).

Рис. 3.8. Паттерны глагола пилить.
Для краткости мы не повторяем каждый раз в паттерне сам глагол, а только отмечаем его место в конструкции обозначением VERB (по примеру словаря Verbalex).
Паттерны глагола пилить распределяются только по первым 5 категориям, для него не встретилось ошибок или упоминаний. Зеленым цветом выделен эллипсис, для этого паттерна было невозможно определить семантический тип объекта действия. Фиолетовым цветом мы выделяли устойчивые выражения, идиомы. В данном случае это один фразеологизм: пилить сук, на котором сидишь. Красным цветом обозначены авторские эксплуатации, которые представлены для глагола пилить одним контекстом Борис Натанович продолжил < пилить > толстое бревно литературы двуручной пилой. Автор эксплуатирует нормативный паттерн [[Human]] пилит [[Wood]] ([[Artifact]]). Подобные первичные нормы выделены черным цветом. Их можно обобщить следующим образом: человек или созданный им инструмент пилит какой-то неодушевленный объект, чаще всего древесину. Поскольку объект с семантическим типом [[Wood]] встречался очень часто, мы выделили его в отдельный паттерн. Остальные частотные контексты, обозначенные синим цветом,  это вторичные нормы. Как можно увидеть, в них глагол пилить используется метафорически, но с устойчивым значением, общим для всех носителей языка. Паттерн [[Human]] пилит на [[Musical_Instrument]] встретился в нашей выборке только один раз, но мы классифицировали его как вторичную норму, поскольку это употребление описано в толковом словаре русского языка под ред. А.П. Евгеньевой [11]. Что касается категорий, не представленных для глагола пилить, то ошибки выделялись оранжевым цветом, а упоминания – желтым.
Дополнительно мы посчитали абсолютную и относительную частоту встречаемости для каждого паттерна. В случае глагола пилить первые 6 паттернов покрывают практически 90% всех встретившихся контекстов. При этом отсутствуют резкие «перепады» частот между паттернами, разница не превышает 10 %. Такое распределение частот встречается не всегда, есть и глаголы, для которых характерны 1-2 паттерна с очень большой встречаемостью. Например, у глагола рожать первые два паттерна имеют относительную частоту 62,63% и 31,32% соответственно, охватывая тем самым более 90% всей выборки.


    1. Достарыңызбен бөлісу:
1   ...   15   16   17   18   19   20   21   22   ...   28




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет