245
применения теории распознавания, как кластерный анализ (таксономия), выявление
закономерностей в множестве экспериментальных данных, прогнозирование различных
процессов или явлений широко используются в научных исследованиях. Большую роль
методы
распознавания
(классификации)
играют
в
активно
развивающихся
интеллектуальных информационных системах.
В данной работе предлагается подход, состоящий в построении систем распознавания
рукописного текста, объединяющих модули выделения признаков и классификатор с
применением нейронных сетей, имеющих меньшее количество весов относительно
многослойных полносвязных нейронных сетей. Системы должны сами выделять признаки и
обладать инвариантностью к искажению входных символьных изображений. Предлагается
метод построения таких систем на основе сверточных нейронных сетей.
Исследуем алгоритм пошаговой реализации модулей программ, для мультиагентной
нейронной сети, которая одновременно, разными методами распознает текст.
Логика последовательности модулей программы:
1) Последовательное применение графических фильтров:
- удаление шумовых помех
- скелетизация изображения
- округление углов и выравнивание линий
2) Выделение букв:
- разбивка изображения на строки
- разбивка строк на слова
- разбивка слов на буквы
методом предсказания длин [1-2,4]
- вычисление угла наклона букв
3) Обучение нейронов Кохонена-Гроссберга:
- векторизация символов с учетом угла наклона
- сравнение выявленных символов с эталонами из базы данных [3,5]
4) Орфографический и грамматический анализ:
- поиск в базе данных слов по найденным буквам
- выявление наиболее вероятных слов в
предложении по найденным словам
- предсказание слов по количеству букв и по смыслу предложения
5) Сохранение результатов:
- обучение нейронов по принятому изображению и результатов распознавания
- при отсутствии в базе данных подобного подчерка - создается новый профиль для
сохранения эталонных векторов
Помимо вышеуказанных пунктов нейронная сеть, должна будет применить уже известные
методы и алгоритмы распознавания для повышения качества. Модель мультиагентной сети
позволит
методом голосования между всеми методами распознавания выделять лучшие
результаты. Кроме того, в мультиагентную сеть можно постоянно добавлять новые
подпрограммы, которые в итоге станут способны решать широкий спектр задач машинного
зрения.
Предлагаемый для разработки исследование позволит создать систему автоматизации
документооборота, которая обязательно присутствуют в средствах ввода бумажных
документов, естественно, путем сканирования. Задача распознавания произвольного
рукописного текста является актуальной сегодня, и
проблема не будет закрыта в ближайшие
десятилетия. Задача распознавания рукописных текстов как научная проблема и как
информационная технология находится на подъеме, благодаря большому интересу к этой
области в
коммерческих кругах, среди компьютерных компаний, в научном сообществе.
Достарыңызбен бөлісу: