Атты І халықаралық конференция ЕҢбектері

С.А. АЛТЫНБЕК, М.М. МУРАТБЕКОВ, А.М. АБЫЛАЕВА, А.С. ТУРГИНБАЕВА

жүктеу/скачать 8,57 Mb.

Pdf көрінісі

бет	248/326
Дата	07.01.2022
өлшемі	8,57 Mb.
	#19269

1 ... 244 245 246 247 248 249 250 251 ... 326

Байланысты:
Болатбек М. (1)

ЛОГИКА ПОСТРОЕНИЯ АЛГОРИТМОВ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ РУКОПИСНОГО КАЗАХСКОГО ТЕКСТА

С.А. АЛТЫНБЕК, М.М. МУРАТБЕКОВ, А.М. АБЫЛАЕВА, А.С. ТУРГИНБАЕВА

Евразийский национальный университет им. Л.Н. Гумилева, Астана, Казахстан

ЛОГИКА ПОСТРОЕНИЯ АЛГОРИТМОВ НЕЙРОННЫХ СЕТЕЙ ДЛЯ
РАСПОЗНАВАНИЯ РУКОПИСНОГО КАЗАХСКОГО ТЕКСТА

Целью  данной  работу  является  исследование  распознавания  рукописного  казахского
текста  и  проверка  распознанного  текста  на  орфографию  и  морфологию  казахского  языка.
Реализации  данной  проблемы  актуально  для  Казахстана,  которая  бы    переносила
накопленную веками информацию в книгах и рукописных текстах в цифровую информацию.
Реализация  методов  распознавания  необходима  также  в  автоматизированных  системах,
предназначенных  для  использования  в  криминалистике,  медицине,  военном  деле.  Такие

245

применения  теории  распознавания,  как  кластерный  анализ  (таксономия),  выявление
закономерностей  в  множестве  экспериментальных  данных,  прогнозирование  различных
процессов  или  явлений  широко  используются  в  научных  исследованиях.  Большую  роль
методы
распознавания
(классификации)
играют
в
активно
развивающихся
интеллектуальных информационных системах.
В  данной  работе  предлагается  подход,  состоящий  в  построении  систем  распознавания
рукописного  текста,  объединяющих  модули  выделения  признаков  и  классификатор  с
применением  нейронных  сетей,  имеющих  меньшее  количество  весов  относительно
многослойных полносвязных нейронных сетей. Системы должны сами выделять признаки и
обладать  инвариантностью  к  искажению  входных  символьных  изображений.  Предлагается
метод построения таких систем на основе сверточных нейронных сетей.
Исследуем  алгоритм  пошаговой  реализации  модулей  программ,  для  мультиагентной
нейронной сети, которая одновременно, разными методами распознает текст.
Логика последовательности модулей программы:
1) Последовательное применение графических фильтров:
- удаление шумовых помех
- скелетизация изображения
- округление углов и выравнивание линий
2) Выделение букв:
- разбивка изображения на строки
- разбивка строк на слова
- разбивка слов на буквы методом предсказания длин [1-2,4]
- вычисление угла наклона букв
3) Обучение нейронов Кохонена-Гроссберга:
- векторизация символов с учетом угла наклона
- сравнение выявленных символов с эталонами из базы данных [3,5]
4) Орфографический и грамматический анализ:
- поиск в базе данных слов по найденным буквам
- выявление наиболее вероятных слов в предложении по найденным словам
- предсказание слов по количеству букв и по смыслу предложения
5) Сохранение результатов:
- обучение нейронов по принятому изображению и результатов распознавания
-  при  отсутствии  в  базе  данных  подобного  подчерка  -  создается  новый  профиль  для
сохранения эталонных векторов
Помимо вышеуказанных пунктов нейронная сеть, должна будет применить уже известные
методы и алгоритмы распознавания для повышения качества. Модель мультиагентной сети
позволит  методом  голосования  между  всеми  методами  распознавания  выделять  лучшие
результаты.  Кроме  того,  в  мультиагентную  сеть  можно  постоянно  добавлять  новые
подпрограммы, которые в итоге станут способны решать широкий спектр задач машинного
зрения.
Предлагаемый  для  разработки  исследование  позволит  создать  систему  автоматизации
документооборота,  которая  обязательно  присутствуют  в  средствах  ввода  бумажных
документов,  естественно,  путем  сканирования.  Задача  распознавания  произвольного
рукописного текста является актуальной сегодня, и проблема не будет закрыта в ближайшие
десятилетия.  Задача  распознавания  рукописных  текстов  как  научная  проблема  и  как
информационная  технология  находится  на  подъеме,  благодаря  большому  интересу  к  этой
области в коммерческих кругах, среди компьютерных компаний, в научном сообществе.

жүктеу/скачать 8,57 Mb.

Достарыңызбен бөлісу:

1 ... 244 245 246 247 248 249 250 251 ... 326