274
Согласно этой модели база данных состоит из N взаимосвязанных компонент для каждого
из используемых языков.
Каждая из компонент имеет независимую структуру,
обусловленную языковой спецификой. Компоненты взаимосвязаны между собой на уровне
лексических эквивалентов (семантический код) и морфологических категорий.
Компонента для каждого языка содержит как лексическую, так и морфологическую
информацию. Это сделано с целью оптимизации поиска в базе данных, чтобы в одном
словаре базы данных производить поиск требуемой компоненты только один раз,
одновременно вытаскивая из него как морфологическую информацию, так и информацию о
лексических эквивалентах найденной лексемы.
Структуру словаря основ для одного языка можно видеть в таблице 1, где представлен
фрагмент заполнения словаря основ для татарского языка.
Таблица 1
Достарыңызбен бөлісу: