Атты І халықаралық конференция ЕҢбектері



Pdf көрінісі
бет264/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   260   261   262   263   264   265   266   267   ...   326
2. Лингвистические ресурсы 
Для  решения  задачи  создания  переводчика  требуется  большое  количество 
лингвистических  ресурсов,  соответственно,  нами  был  произведен  анализ  имеющегося  на 
сегодня  материала,  готового  для  использования  в  проекте.  Анализ  показал,  для  
использования  в  задачах  перевода  между  татарским  и  другими  тюркскими  языками  в 
настоящее время реально доступны только  татарско-турецкий и турецко-татарский словари 
объемом  около  20  000  словарных  статей.  Вместе  с  тем,  даже  эти  словари  изданные  в 
бумажном  виде,  не  представлены  в  Интернете  в  электронном  виде.  Из  этого  следует,  что 
необходимо активизировать работу по созданию многоязычного словаря тюркских языков. 
Авторами  предложена  структура  многоязычного  словаря,  в  соответствии  с  которой 
словарь  должен  содержать  в  себе  не  только  лексическую,  но  и  морфологическую 
информацию (рис.3).  
 
 
 
Рис.3. Архитектура базы данных с многоязычным словарем 


274 
 
Согласно этой модели база данных состоит из N взаимосвязанных компонент для каждого 
из  используемых  языков.
 
Каждая  из  компонент  имеет  независимую  структуру, 
обусловленную  языковой  спецификой.  Компоненты  взаимосвязаны между  собой  на  уровне 
лексических эквивалентов (семантический код) и морфологических категорий.  
Компонента  для  каждого  языка  содержит  как  лексическую,  так  и  морфологическую 
информацию.  Это  сделано  с  целью  оптимизации  поиска  в  базе  данных,  чтобы  в  одном 
словаре  базы  данных  производить  поиск  требуемой  компоненты  только  один  раз, 
одновременно вытаскивая из него как морфологическую информацию, так и информацию о 
лексических эквивалентах найденной лексемы. 
Структуру  словаря  основ  для  одного  языка  можно  видеть  в  таблице  1,  где  представлен 
фрагмент заполнения словаря основ для татарского языка. 
 
Таблица 1 


Достарыңызбен бөлісу:
1   ...   260   261   262   263   264   265   266   267   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет