Российский датасет помог европейским ученым ускорить обучение ИИ почти в 60 раз

Открытый датасет "Яндекса" позволил исследовате...

freepik.com

MaxДзенTelegram

Российский набор данных ускорил обучение ИИ-рекомендаций у европейских ученых

Как сообщила пресс-служба Яндекса в ТАСС, созданный в России масштабный набор данных для рекомендательных систем помог европейским исследователям ускорить обучение ИИ почти в 60 раз без потери качества. Этот шаг демонстрирует практическую ценность открытых данных для глобальной разработки ИИ.

Состав и масштаб Yambda

В начале лета 2025 года Яндекс опубликовал Yambda — один из крупнейших мировых наборов данных для рекомендательных систем. Он содержит пять миллиардов элементов и построен на обезличенных данных Яндекс.Музыки, включая агрегированные прослушивания, лайки, дизлайки и характеристики треков.

Применение в европейских исследованиях

Ученые из Амстердамского университета использовали Yambda для разработки нового подхода к обучению рекомендательных систем на основе алгоритма SEATER, созданного китайскими специалистами. Этот подход организует товары и треки в иерархический каталог, ускоряющий работу системы рекомендаций.

Результаты ускоренного обучения

Тестирование двух альтернативных методов подготовки каталога на данных Яндекса показало, что один из алгоритмов сократил время обработки с 82 минут до 83 секунд — почти в 60 раз. Качество рекомендаций при этом практически не снизилось. Весь код улучшенной модели SEATER выложен в открытый доступ, демонстрируя пользу публикации больших наборов данных для обучения ИИ.

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

Читайте также:

MaxДзенTelegramВКонтактеОдноклассники