Учёные выяснили, как нейросети распознают и объясняют каламбуры

Технологии

Анастасия Максименко Главный редактор

Международная команда исследователей с участием специалистов факультета компьютерных наук НИУ ВШЭ создала корпус KoWit‑24, включающий 2700 новостных заголовков с игрой слов. Новый ресурс предназначен для оценки того, насколько искусственный интеллект способен находить и интерпретировать языковую игру. Об этом сообщили в пресс‑службе вуза изданию «Жуковский.Life».

В экспериментах протестировали пять крупных языковых моделей, среди которых GPT‑4o и GigaChat. Результаты показали, что даже современные системы часто ошибаются при работе с каламбурами. Модели в целом лучше справляются с обнаружением заголовков с игрой слов, чем с объяснением, на чём именно основан каламбур и какие значения пересекаются.

Один из авторов работы, доцент ФКН НИУ ВШЭ Павел Браславский отмечает, что KoWit‑24 решает две важные проблемы предыдущих наборов данных: корпус даёт контекст к каждому заголовку и содержит многоуровневую разметку. Это, по его словам, превращает подборку примеров в полноценный «тестовый стенд» для проверки и сравнения моделей ИИ.

Игра слов остаётся распространённым приёмом в российских новостных заголовках, где её используют для привлечения внимания или усиления иронии. В качестве примера приводится заголовок «Особо бумажные персоны», обыгрывающий выражение «особо важные персоны».

Новый корпус включает заголовки за 2021–2023 годы с пометками типа приёма, ключевых слов и отсылок. Результаты исследования представлены на конференции RANLP, а сам корпус опубликован в открытом доступе, что позволяет другим командам использовать его для обучения и тестирования языковых моделей.

Учёные выяснили, как нейросети распознают и объясняют каламбуры

Читайте также:

Невролог Гайфутдинов объяснил связь переутомления и обмороков у россиян

Диетологи перечислили фрукты, опасные при болезнях печени и почек

Популярное

Владимир Пономарев прошел с критикой по сыну Плющенко за слова о Яшине

Бизнесмен из Самары Аветисян проиграл спор с «Роснано» на 11,9 млрд

Ученые подсчитали, когда на Земле исчезнет последнее зеленое растение

«Турпром»: турки обсуждают, что в страну стали прилетать бедные иностранцы

Обзор долгожданной автомобильной новинки: TENET Т4L

У экс-главы кассационного суда Ефанова требуют конфисковать имущество на 1,2 млрд

Замглавы Минздрава Котова перечислила 5 сокращающих жизнь факторов

Над Самарской областью сбили беспилотники

Акулу-домового впервые сняли живой в дикой природе

Бенефициары СПЗ-4, продававшие контрафакт на оборонку, просятся к женам

Россияне меняют планы на отдых из-за проблем с бензином

Метеозависимых россиян предупредили о магнитной буре на Солнце

В Самаре подешевели огурцы и помидоры

В Самаре начальника научной части вуза осудили за мошенничество на 4 млн рублей

Кетодиета при психозах: первые итоги обнадеживают

ГК «Полипласт» представила инновационные разработки и социальные инициативы на выставке ИННОПРОМ-2026

Активированный уголь и валидол подорожали в Самарской области

Алексей Лейпи: первичный рынок перегрет предложением, вторичный набирает обороты

Cпортивный фестиваль «ВТБ Лука Ультра трейл и байк» пройдет 11 и 12 июля в Самарской области