СОВЕРШЕНСТВОВАНИЕ АЛГОРИТМА РАСПОЗНАВАНИЯ РУКОПИСНЫХ ТЕКСТОВ НА ОСНОВЕ НОРМИРОВАНИЯ ИЗОБРАЖЕНИЯ

УДК 004.352.243

И.Я. Львович, Я.Е. Львович, А.А. Мозговой, А.П. Преображенский, О.Н. Чопоров

Одним из популярных подходов, применяемых для распознавания рукописного текста, является представление изображений целых слов в виде последовательностей символов марковской цепи. Набор извлекаемых из изображений символов анализируется на предмет соответствия заранее подготовленным моделям слов (модели-шаблоны). Слово, модель которого обладает наибольшей вероятностью формирования анализируемой последовательности, признаётся искомым. Вариативность написания рукописных слов приводит к необходимости анализа извлекаемой из изображения последовательности символов моделями, сформированными для слов, состоящих из разного количества символов. В случае, когда анализируемое слово отличается от слова, используемого для модели-шаблона только окончанием, модель-шаблон более длинного слова получает математическое преимущество над моделью более короткого слова, что приводит к ошибкам распознавания. В статье предлагается для уменьшения ошибок распознавания нормирование изображения.

Ключевые слова: оптическое распознавание, рукописный текст, оконное сканирование, СММ.

Полный текст статьи:
LvovichSoavtors_3_16_1.pdf