Атты І халықаралық конференция ЕҢбектері


О программной технологии создания электронных словарей



Pdf көрінісі
бет162/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   158   159   160   161   162   163   164   165   ...   326
Байланысты:
Болатбек М. (1)

3. О программной технологии создания электронных словарей 
За период от разработки в НКО "ИНСАН" первых вариантов электронных словарей с 2007 
г.до  настоящего  времени  было  испытано  несколько    версий  программной  реализации 
технологической  цепочки  создания  словарей.  Это  был  естественный  процесс.  За  это  время 
существенно  изменилась  компьютерная  база,  изменились  операционные  системы, 
трансляторы  программ,  появились  более  мощные  редакторы  текстов,  в  инструментальных 
программных  средствах  обеспечена  возможность  работать  с  UNICOD-ом.  Это 
стимулировало  принятие  решения  о  разработке  новой  технологической  цепочки 
программных средств для реализации электронных мультимедийных словарей для тюркских  
языков  и  приложений  на  их  основе.  Этот  процесс  непрерывного  обновления,  развития  и  
совершенствования  программных  технологических  средств  объективно  закономерен  и 
продолжается по настоящее время. 
Создание  электронного  словаря  проходит  ряд  этапов.  На  подготовительном  этапе 
формируется    исходный    текст  словаря.  Словари    могут  быть  различного  назначения  – 


158 
 
дву(много)язычные,    фразеологические,  толковые  и  др.  На  этом  этапе  осуществляется  в 
основном  лингвистическая  проработка  словаря:  составление  словарных    статей,  выбор    их 
структуры,  информационных полей и пр., производится их заполнение соответствующими 
данными. Отметим, что при этом структура словарной статьи  остается неизменной  для всех 
словарных статей данного словаря.  Естественно, она  может измениться для  других типов 
словарей.  Исходный  текст  нового  словаря  может  создаваться    в  отсутствии    прототипа    с 
"чистого листа", как в случае со словарем [7]. Часто  исходный текст  словаря    заимствуется 
из  ранее  изданных    «бумажных»  словарей.  В    электронном  переиздании      «бумажного» 
словаря структура  словарных статей при необходимости может быть изменена,  например, 
добавлены новые  информационные поля.  Лингвистическая проработка словарных статей на 
подготовительном    этапе    производится    с  помощью    специальных  сервисных  программ, 
призванных    максимально  облегчить    подготовительную  работу  лингвиста,  в  частности, 
обеспечить  быстрый  доступ  к  справочной  информации.  Результатом  подготовительного 
этапа является лингвистически выверенный текст словаря.  
На  следующих  этапах  программная  технологическая  цепочка  включает  программы 
разбора  текста  словаря  (парсер),    заполнения  базы  данных,  подготовки  звуковых  файлов,  
выполнения других операций по проверке целостности и защите  базы данных. Программа 
разбора  текста  имеет  ряд  режимов  работы,  предназначенных  для  проверки  текста  с  целью 
выявления и устранения нарушений  принятой структуры словарных статей. В этих режимах 
выводятся фрагменты текста с обнаруженными ошибками, указывается их местоположение. 
Нарушения  могут  быть  самыми  различными,  например,    отсутствие  данных  в  некоторых 
информационных полях словарной статьи, перевода, ключевого слова, служебных символов 
разметки  текста  и  т.д.  Помимо  этого,  парсер  подготавливает  таблицу  входов  для  записи 
звукового файла перевода. 
Заполнение базы данных выполняется после завершения коррекции текста всех словарных 
статей  процедурой,  которую  вызывает  парсер.  Разработчику  предоставляется  возможность 
контроля  состояния  базы  данных,  редактирования  словарных  статей  и  другие  операции 
коррекции. 
Запись звуковых переводов производится в диалоговом режиме.  Диктору- оператору  на 
экране предоставляется таблица входов. В таблице отмечаются входы, для которых имеются 
подготовленные для озвучивания тексты из словарных статей.  Диктор выбирает в таблице 
вход, для которого нужно записать звуковой файл  перевода, инициирует запись и голосом 
прочитывает(произносит)  показанный  ему  в  диалоговом  окне    текст.  Процесс  записи 
останавливает  также  диктор,  после  чего  программа  записи    автоматически  формирует 
название файла и записывает созданный звуковой файл в формате MP3  в базу данных. Затем 
операция  записи  повторяется  для  другого  входа.  Для  удобства  контроля  записи    на  экране 
все  время  индицируется  уровень  шума  в  помещении.  После  завершения  записи  можно 
прослушать  записанное  и  при  необходимости  перезаписать  текущий  или  любой  из  ранее 
записанных  звуковых  файлов.  Можно    также  воспользоваться    специальным  фирменным 
программным обеспечеиием редактирования звуковых файлов и подавления помех[8]. 


Достарыңызбен бөлісу:
1   ...   158   159   160   161   162   163   164   165   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет