Образовательная программа «Прикладная, экспериментальная и математическая лингвистика»


Erlangen Valency Patternbank (EVP)



бет5/28
Дата14.05.2023
өлшемі1,12 Mb.
#92943
түріОбразовательная программа
1   2   3   4   5   6   7   8   9   ...   28
Erlangen Valency Patternbank (EVP)

На базе VDE был создан Erlangen Valency Patternbank6.
Цель данного проекта  создание инструмента, позволяющего лингвистам исследовать валентность глаголов и семантические роли аргументов [27]. Лексемы, представленные в данном словаре, повторяют словник VDE. EVP позволяет найти:

  • полный список рамок валентности английских глаголов (в активном и пассивном залоге), существительных и прилагательных (по VDE);

  • для каждой рамки валентности  список лексем, активирующих её (по VDE);

  • для каждой лексемы  все рамки валентности (по VDE).

Рамки валентностей (рис. 1.2) описываются с помощью поверхностно-ориентированных формальных категорий, например, NP - noun phrase. Такое описание, по утверждению авторов, наиболее независимо от разницы в теориях. Семантические роли употребляются так же, как и в VDE.

Рис. 1.2. Пример словарной статьи из EVP для глагола enjoy.

        1. Framenet

Проект Framenet7 представляет собой базу данных для английского языка, объемом более 10 000 значений. Материал  более 170000 вручную размеченных предложений. Основателем Framenet являлся Чарльз Филлмор, создатель теории фреймовой семантики (frame semantics). Главной идеей является положение о том, что значение слова можно вывести из его семантических фреймов (описания события, отношения или сущности и партиципантов в нём). Так, процесс готовки обычно включает человека, который готовит еду (Cook), еду, которая готовится (Food), посуду, в которой готовится еда (Container) и источник тепла (Heating_instrument). В Framenet данный сценарий называется Apply_heat и включает в себя вышеперечисленные элементы фрейма. Глаголы, которые могут активировать данный фрейм в предложении, называются его лексическими единицами [34]. FrameNet описывает и глаголы, и существительные, но только те, которые в состоянии сами активировать фрейм.
Одним из недостатков словаря FrameNet является то, что при его создании не использовались корпусные данные [32]. Создатели отталкиваются не от слова, а от фрейма, реальной ситуации, и, описывая её, пользуются своими собственными представлениями о мире и о словоупотреблении. Таким образом, значения слова представляются не систематично и не исчерпывающим образом.
Разметка фрейма (рис. 1.3) состоит из трех уровней для каждого элемента: имя элемента фрейма (к примеру, Food), грамматическая функция (Object) и тип группы (NP).

Рис. 1.3. Пример словарной статьи из Framenet для глагола enjoy.


      1. Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   ...   28




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет