В России хотят автоматизировать работу с рукописными историческими документами

freepik.com
В России разрабатывают систему для автоматизации работы с рукописными документами
Специалисты факультета вычислительной математики и кибернетики МГУ создали алгоритм для автоматического поиска ключевых слов в рукописных текстах. Разработка упрощает обработку архивных документов и исторических источников. Об этом сообщает ТАСС.
Особенности подхода
Система рассматривает рукописный текст как последовательность штрихов — базовых элементов письма, формируемых движением пера. Алгоритм сегментирует изображение на штрихи, нормализует их и классифицирует с использованием математических описаний формы. Далее выполняется сопоставление последовательностей штрихов запроса и документа для поиска совпадений и оценки точности.
Преимущества метода
В отличие от стандартных программ распознавания текста, система не пытается сразу «прочитать» написанное, а работает напрямую с изображением. Это позволяет обойти ограничения классических методов, сохраняя визуальные особенности текста, что важно для архивов и исторических документов.
Результаты экспериментов
В экспериментах с реальными рукописями алгоритм показал высокую точность обнаружения заданных элементов. Разработка может применяться при обработке архивных документов, исторических рукописей и материалов в виде сканов и фотографий.
Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.
Читайте также:
- Даже близким такое лучше не рассказывать: эти 10 вещей могут обернуться против вас
- С апреля всё изменится: новые правила на Ozon и Wildberries — что важно знать покупателям
- До апреля лучше снять часть средств с карты: банки готовят неожиданные изменения
- Без жарки и вредного масла: один простой приём делает эти котлеты невероятно сочными
- Вы всё это время покупали не то масло: Роскачество назвало самые безопасные марки



