Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Science в Lamoda: особенности применения M...

Zhanna
April 04, 2024
1.2k

Data Science в Lamoda: особенности применения ML в Fashion E-commerce

Александр Желубенков, Head of Data Science в Lamoda Tech

Zhanna

April 04, 2024
Tweet

More Decks by Zhanna

Transcript

  1. Data Science в Lamoda: Особенности применения ML в Fashion E-commerce

    Александр Желубенков Head of Data Science
  2. 2 17 млн MAU 600.000+ товаров Lamoda – одна из

    крупнейших e-commerce компаний в России в сфере Fashion & Lifestyle 4.000+ брендов
  3. 3 ML-инфраструктура PySpark Airflow Hadoop Kafka Python CatBoost PyTorch Elasticsearch

    Golang 3.5 Пбайт размер DWH + Data Lake Hadoop 600+ млн событий ежедневно с 4-х платформ Hadoop 20TB RAM, 3000+ Vcores
  4. 5 Направления, в которых применяем ML Ранжирование каталога и поиск

    Рекомендательные системы Клиентский опыт Маркетинг
  5. 6 Направления, в которых применяем ML Динамическое ценообразование Операции (Доставка

    и склад) Рекламная платформа Клиентский опыт Эффективность бизнеса Ранжирование каталога и поиск Рекомендательные системы Маркетинг
  6. 7 Направления, в которых применяем ML Data-платформа и MLOps AB-платформа

    Клиентский опыт Эффективность бизнеса Платформенные внутренние продукты Динамическое ценообразование Операции (Доставка и склад) Ранжирование каталога и поиск Рекомендательные системы Рекламная платформа Маркетинг
  7. 8 Направления, в которых применяем ML Data-платформа и MLOps AB-платформа

    Клиентский опыт Эффективность бизнеса Платформенные внутренние продукты Динамическое ценообразование Операции (Доставка и склад) Ранжирование каталога и поиск Рекомендательные системы Рекламная платформа Маркетинг • Монетизируем каждое из направлений • Суммарно более 30 ML-моделей в проде • Уменьшаем TTM • Повышаем надежность принятия решений
  8. 10 5 особенностей Fashion E-commerce #5. Сезонность Закупка и ценообразование

    #3. Поиск и ранжирование Fashion-термины и фильтры #4. Продуктовая воронка Таргеты для обучения #1. Визуальная составляющая Фото и атрибуты #2. Физическая составляющая Размеры и примерка
  9. 11 Особенность #1. Визуальная составляющая • Описание и отображение товара

    в продукте • Специализированные инструменты поиска
  10. 13 Фотографии: • эксперименты с кропом, ретушью и порядком фотографий

    (обучаясь на поведении пользователей) Атрибуты: • автоматизация и обогащение описания новыми атрибутами: - тип: сумка-седло, размер: маленькая Где можно применять ML Важно красивое фото и детальное описание
  11. 16 • находить баланс визуальной похожести и уместности ценового сегмента,

    материала (конечной целью является покупка) Что важно для применения ML Полезны специализированные инструменты поиска Поиск по фото Визуально похожие С чем носить
  12. 17 Будущее уже близко – виртуальная примерка • https://tryondiffusion.github.io/ •

    https://github.com/minar09/awesome-virtual-try- on + Куртка из каталога Lamoda
  13. 19 Выбор размера это сложно Не понимаю, как выбрать размер:

    • не буду заказывать • закажу не тот размер • закажу несколько размеров
  14. 20 Выбор размера это сложно Не понимаю, как выбрать размер:

    • не буду заказывать • закажу не тот размер • закажу несколько размеров Отказ на этапе примерки: • не “село” на мою фигуру • не те свойства материала: плотность ткани, качество • вещь потеряла товарный вид после предыдущей примерки
  15. 21 Сближаем онлайн и оффлайн опыт пользователя • рекомендация размера

    для пользователя • выделение полезных характеристик из отзывов: “Платье большемерит на размер. Трикотаж тонкий, мягкий и приятный к телу” • модель определения брака после серии примерок Где полезно применять ML Ожидание vs реальность
  16. 22 Особенность #3. Поиск и ранжирование в Fashion • Fashion-термины

    в поиске • Частое применение фильтров
  17. 23 Текстовый поиск в Fashion 70% потока состоит из простых

    запросов: • “бренды” - (adidas, mango) • “категория + гендер” (джинсы женские) ... В оставшихся 30% есть много сложных и интересных кейсов: • “треники со шнурком на поясе”
  18. 24 Разбираемся в Fashion терминах 1. пуловер 2. свитер 3.

    кардиган 4. джемпер 5. толстовка 6. свитшот 7. … 8. или просто кофта?
  19. 25 Поисковые запросы отличаются от описаний товаров Name: джемпер 1.

    пуловер 2. свитер 3. кардиган 4. джемпер 5. толстовка 6. свитшот 7. … 8. кофта - отсутствует в названиях товаров
  20. 26 Текстовый поиск в Fashion Поиск по словам (TF-IDF) для

    простых запросов: • синонимия и транслиты: “кофта найк” Векторный поиск (Embedding-based) для сложных запросов С точки зрения применения ML
  21. 27 Фильтрация и ранжирование Отбор кандидатов: • нужно уметь применять

    фильтрацию Ранжирование: • популярность товара важнее релевантности поисковому запросу С точки зрения применения ML Все товары 100 - 1.000 товаров 60 товаров Уровень 2. Тяжелое ранжирование Уровень 1. Отбор кандидатов: Фильтрация + легкое ранжирование
  22. 28 Особенность #4. Продуктовая воронка и примерка Показ товара Клик

    Добавление в корзину Заказ Покупка Возврат Примерка
  23. 29 Как выбирать таргеты для обучения? Показ товара Клик Количество

    данных Отложенность таргета Учет размеров много: 10+ млн / день быстрый нет
  24. 30 Как выбирать таргеты для обучения? Показ товара Клик Добавление

    в корзину Количество данных Отложенность таргета Учет размеров много: 10+ млн / день быстрый нет достаточно: 1+ млн / день быстрый да
  25. 31 Как выбирать таргеты для обучения? Показ товара Клик Добавление

    в корзину Заказ Количество данных Отложенность таргета Учет размеров много: 10+ млн / день быстрый нет достаточно: 1+ млн / день быстрый да мало: 100к+ / день отложенный (время на выбор вещей) да
  26. 32 Как выбирать таргеты для обучения? Показ товара Клик Добавление

    в корзину Заказ Покупка Возврат Примерка Количество данных Отложенность таргета Учет размеров много: 10+ млн / день быстрый нет достаточно: 1+ млн / день быстрый да мало: 100к+ / день отложенный (время на выбор вещей) да мало: 100к+ / день сильно отложенный (время на доставку) да
  27. 33 Как выбирать таргеты для обучения? Показ товара Клик Добавление

    в корзину Заказ Покупка Возврат Примерка • Сложность в оптимизации end-to-end (показывая товар, думаем о возвратах и операционных издержках) • Неоднозначность в выборе таргетов (хорошим вариантом для старта может быть добавление в корзину) С точки зрения применения ML
  28. 34 Особенность #5. Сезонность в Fashion • Два сезона: Spring/Summer

    и Fall/Winter • Специфика Lamoda – для 50% ассортимента продавцом является сама Lamoda • Ранняя закупка ассортимента – как правило за 6+ месяцев до старта продаж.
  29. 35 Особенность #5. Сезонность в Fashion • Два сезона: Spring/Summer

    и Fall/Winter • Специфика Lamoda – для 50% ассортимента продавцом является сама Lamoda • Ранняя закупка ассортимента – как правило за 6+ месяцев до старта продаж. • Цель на сезон – распродать бОльшую часть стока с максимальной эффективностью – нужно оптимальное управление скидками
  30. 36 Особенность #5. Сезонность в Fashion С точки зрения применения

    ML • Два сезона: Spring/Summer и Fall/Winter • Специфика Lamoda – для 50% ассортимента продавцом является сама Lamoda • Ранняя закупка ассортимента – как правило за 6+ месяцев до старта продаж. • Цель на сезон – распродать бОльшую часть стока с максимальной эффективностью – нужно оптимальное управление скидками Закупка: • строить долгосрочные прогнозы по объему спроса Ценообразование: • оценивать эластичность спроса в разные моменты сезона • строить долгосрочный прогноз продаж до конца сезона • расставляя скидки, оптимизировать комбинацию метрик (выручка, прибыль, реализация стока)
  31. 37 5 особенностей Fashion E-commerce #5. Сезонность Закупка и ценообразование

    #3. Поиск и ранжирование Fashion-термины и фильтры #4. Продуктовая воронка Таргеты для обучения #1. Визуальная составляющая Фото и атрибуты #2. Физическая составляющая Размеры и примерка