Образовательная программа «Прикладная, экспериментальная и математическая лингвистика»



бет8/28
Дата14.05.2023
өлшемі1,12 Mb.
#92943
түріОбразовательная программа
1   ...   4   5   6   7   8   9   10   11   ...   28
Байланысты:
Diplom 2017 Godgildieva (1)

Семантический словарь Тузова

Семантический словарь В. А. Тузова представляет собой описание слов русского языка на формальном семантическом языке. Словарь строился на базе «Большого толкового словаря русского языка» и некоторых других словарей. По состоянию на 2007 год словарь В.А. Тузова содержал 164 тысячи слов [9].
Все слова делятся на 2 большие группы: базовые и производные. Базовые слова в рамках данного описания не выражаются через другие. Для них указывается иерархический класс, например, слово ребенок получает класс: существительное > физический объект > живой > человек > ребенок. Иерархия классов базовых понятий содержит более 1500 классов. Производные слова описываются не только через класс, но и с помощью базовых функций, например, каузировать, отрицание и т.д. Например, глагол оценивать определяется как Caus(!Им,IncepHab(!Вин,ЦЕНА$110161(!вВин))), т.е. делать так, чтобы что-то получило цену.
Для наших целей нам важно, как в словаре представлена валентность глаголов. Она определяется через синтактико-семантическую формулу слова (рис. 1.7), которая включает классы и падежи возможных синтаксических актантов исходного глагола [17].

Рис. 1.7. Пример возможных синтактико-семантических формул для глагола идти.

        1. RussNet

Работа над проектом WordNet была начата в 1985 г. Дж. Миллером в Принстонском университете. В оригинальной версии проекта информация о валентностях глагола отображалась в виде фреймов предложений (sentence frames). Они используются только для автоматического порождения иллюстративного материала, если он не предоставляется лексикографом [35]. Таким образом показывается количество актантов у предиката и варианты их заполнения.
WordNet стал образцом для создания подобных словарей для множества других языков, в т.ч. и русского языка. Из всех русскоязычных версий наиболее полно валентности глаголов русского языка представлены в словаре RussNet [1]. Это одна из русских версий проекта WordNet, начатая в 1999 году на кафедре математической лингвистики СПбГУ. В RussNet у глагольного синсета есть список рамок валентностей с указанием на то, какая рамка соответствует какому члену синсета. Отмечается грамматическая форма аргументов, их порядок и факультативность, наличие или отсутствие предлога, семантические характеристики. Рамка валентностей наследуется от гиперонима к гипониму. Более того, валентность помогает различать значения многозначных глаголов.



        1. Достарыңызбен бөлісу:
1   ...   4   5   6   7   8   9   10   11   ...   28




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет