«Яндекс» разместил в открытый доступ датасет для рекомендательных систем

29.05.2025, 17:05 , Анастасия Федосеева — Главный редактор

Компания «Яндекс» предоставила доступ к массиву данных Yambda — одному из самых обширных в мире специализированных наборов для разработки и тестирования алгоритмических решений в области рекомендаций.

Yambda базируется на обезличенных данных, собранных сервисом «Яндекс Музыка». Этот массив предназначен для использования специалистами, исследователями и образовательными учреждениями, стремящимися усовершенствовать алгоритмы рекомендаций.

Доступны три версии Yambda: полная (5 миллиардов записей о взаимодействиях), средняя (500 миллионов) и малая (50 миллионов), что позволяет выбирать оптимальный объем данных в зависимости от конкретных задач и целей исследований.

Открытые данные включают агрегированные показатели прослушиваний, пользовательские оценки и метаданные музыкальных композиций. Конфиденциальность пользователей и защита их персональных данных гарантированы.

Yabama может быть использован для тестирования и оптимизации систем рекомендаций в различных сферах, таких как киноиндустрия, музыкальная индустрия, электронная коммерция, литература и другие. Эксперты подчеркивают, что доступ к таким данным способствует развитию научных исследований и привлекает молодых специалистов в области машинного обучения и анализа данных, пишет RS.