Учёные создали инструмент для оценки сложности текстов на малых языках

Анастасия Максименко Редактор ленты новостей
Российские исследователи разработали подход для...

freepik.com

Российские исследователи разработали подход для оценки сложности текстов на языках коренных народов России, включая адыгейский, башкирский, бурятский, татарский, осетинский и удмуртский. Как сообщили в пресс-службе НИУ ВШЭ, это первый инструмент, специально адаптированный под морфологические и лексические особенности этих малоресурсных языков.

Научный сотрудник Центра языка и мозга НИУ ВШЭ Ульяна Петрунина рассказала, что параметры модели настроены с учётом структурных характеристик каждого из шести языков. Аналогичным образом была пересчитана и классическая формула индекса удобочитаемости Флеша, что позволило сделать её применимой к языкам с иной грамматикой и типичной длиной слов. По словам исследовательницы, заложенный принцип даёт возможность в дальнейшем относительно просто перенастраивать алгоритм под другие малоресурсные языки.

Разработка рассматривается как один из инструментов реализации Основ государственной языковой политики России, утверждённых указом президента в 2025 году. Документ нацелен на поддержку языкового многообразия и расширение сфер практического использования языков народов страны.

Команда Центра языка и мозга создала онлайн‑сервис, который позволяет оперативно оценивать сложность текста, опираясь на частотный список из 5 тысяч наиболее употребительных слов для каждого языка, а также показатели лексической плотности, разнообразия, динамичности и описательности текста. Авторы рассчитывают, что этот ресурс поможет преподавателям подбирать материалы нужного уровня для обучения, а учёным — формировать сопоставимые тексты‑стимулы для экспериментальных исследований. В перспективе планируется расширить систему за счёт включения других мало описанных в лингвистике языков, как российских, так и зарубежных, сообщает ТАСС.

Читайте также:

Источник: samaraonline24.ru

Читайте в Дзен