В России хотят автоматизировать работу с рукописными историческими документами

Учёные МГУ создали алгоритм, который позволяет ...

freepik.com

MaxДзенTelegram

В России разрабатывают систему для автоматизации работы с рукописными документами

Специалисты факультета вычислительной математики и кибернетики МГУ создали алгоритм для автоматического поиска ключевых слов в рукописных текстах. Разработка упрощает обработку архивных документов и исторических источников. Об этом сообщает ТАСС.

Особенности подхода

Система рассматривает рукописный текст как последовательность штрихов — базовых элементов письма, формируемых движением пера. Алгоритм сегментирует изображение на штрихи, нормализует их и классифицирует с использованием математических описаний формы. Далее выполняется сопоставление последовательностей штрихов запроса и документа для поиска совпадений и оценки точности.

Преимущества метода

В отличие от стандартных программ распознавания текста, система не пытается сразу «прочитать» написанное, а работает напрямую с изображением. Это позволяет обойти ограничения классических методов, сохраняя визуальные особенности текста, что важно для архивов и исторических документов.

Результаты экспериментов

В экспериментах с реальными рукописями алгоритм показал высокую точность обнаружения заданных элементов. Разработка может применяться при обработке архивных документов, исторических рукописей и материалов в виде сканов и фотографий.

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

Читайте также:

MaxДзенTelegramВКонтактеОдноклассники