Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Илья Осиновсков – Машинное обучение для рекомен...

Илья Осиновсков – Машинное обучение для рекомендаций товаров в Ozon

Ozon Tech

July 28, 2023
Tweet

More Decks by Ozon Tech

Other Decks in Technology

Transcript

  1. Ozon Tech 2023 Машинное обучение для рекомендаций товаров в Ozon

    Осиновсков Илья, руководитель группы разработки «Товарные рекомендации»
  2. Рекомендации в Ozon 3 Что делаем? Показываем пользователю релевантные для

    него товары в зависимости от контекста Для чего? Делаем Ozon персонализированным для пользователя, экономим клиенту время, расширяем интересы пользователя на маркетплейсе
  3. Пользовательские признаки Что знаем о пользователе? История действий • Клики

    • Добавления в избранное • Добавления в корзину • Покупки • Пол • Возраст • Устройство 4
  4. Что знаем о товаре? • Название • Описание • Атрибуты

    • Фото • Взаимодействия пользователей 5
  5. Двухуровневая рекомендательная система 6 100+ миллионов товаров Генерация кандидатов Расчет

    признаков Ранжиро- вание моделью Переран- жирование топа с учетом бизнес- правил
  6. Похожие товары Отбор кандидатов • Товары той же категории (10+

    тысяч) o Берем топ N по разным статистикам 9 o Похожесть по фото o Похожесть по названию o Атрибутная похожесть
  7. Похожие товары Основные признаки • Совстречаемость в сессиях пользователей 10

    • Похожесть по фото • Похожесть по названию • Атрибутная похожесть • Конверсии товара
  8. Персональные рекомендации Отбор кандидатов • Похожее на то, с чем

    взаимодействовал 15 • Сопутствующее к тому, что пользователь покупал • Регулярные покупки • Предсказание интересных юзеру категорий • Статические топы
  9. Персональные рекомендации Основные признаки • Релевантность к каждому товару из

    истории пользователя 16 • Конверсии товара относительно соцдем характеристик • Ценовые предпочтения пользователя • Товарные признаки
  10. Модель • Логируем признаки из сервиса через Kafka в Hadoop

    • Заказы Датасет 17 • Добавления в корзину • Клеим таргеты • Клики • Добавления в избранное Учим градиентный бустинг на задачи бинарной классификации или ранжирования
  11. Архитектура решения User-History-API Shelf-API Hadoop Spark URM-server-Go URM-Storage Ceph ID

    юзера Просмотренные, добавленные в корзину, купленные товары Информация о пользователе, контекст рекомендаций Список товаров для показа Кандидаты Логи взаимодействий пользователя с рекомендациями Датасет для обучения моделей Информация о товарах Обновление индекса и моделей Сatboost модели, индекс товаров Фичи рекомендаций 18
  12. Наши вакансии Ведущий Data Scientist (Deep Learning), Рекомендации и персонализация

    Старший Data Scientist, Товарные рекомендации Разработчик Go, Рантайм рекомендаций 20