Семантический словарь В. А. Тузова представляет собой описание слов русского языка на формальном семантическом языке. Словарь строился на базе «Большого толкового словаря русского языка» и некоторых других словарей. По состоянию на 2007 год словарь В.А. Тузова содержал 164 тысячи слов [9].
Все слова делятся на 2 большие группы: базовые и производные. Базовые слова в рамках данного описания не выражаются через другие. Для них указывается иерархический класс, например, слово ребенок получает класс: существительное > физический объект > живой > человек > ребенок. Иерархия классов базовых понятий содержит более 1500 классов. Производные слова описываются не только через класс, но и с помощью базовых функций, например, каузировать, отрицание и т.д. Например, глагол оценивать определяется как Caus(!Им,IncepHab(!Вин,ЦЕНА$110161(!вВин))), т.е. делать так, чтобы что-то получило цену.
Для наших целей нам важно, как в словаре представлена валентность глаголов. Она определяется через синтактико-семантическую формулу слова (рис. 1.7), которая включает классы и падежи возможных синтаксических актантов исходного глагола [17].
Рис. 1.7. Пример возможных синтактико-семантических формул для глагола идти. RussNet
Работа над проектом WordNet была начата в 1985 г. Дж. Миллером в Принстонском университете. В оригинальной версии проекта информация о валентностях глагола отображалась в виде фреймов предложений (sentence frames). Они используются только для автоматического порождения иллюстративного материала, если он не предоставляется лексикографом [35]. Таким образом показывается количество актантов у предиката и варианты их заполнения.
WordNet стал образцом для создания подобных словарей для множества других языков, в т.ч. и русского языка. Из всех русскоязычных версий наиболее полно валентности глаголов русского языка представлены в словаре RussNet [1]. Это одна из русских версий проекта WordNet, начатая в 1999 году на кафедре математической лингвистики СПбГУ. В RussNet у глагольного синсета есть список рамок валентностей с указанием на то, какая рамка соответствует какому члену синсета. Отмечается грамматическая форма аргументов, их порядок и факультативность, наличие или отсутствие предлога, семантические характеристики. Рамка валентностей наследуется от гиперонима к гипониму. Более того, валентность помогает различать значения многозначных глаголов.