Learn-to-Rank или как научить бездушную машину хорошо искать

LEARN-TO-RANK LEARN-TO-RANK ИЛИ КАК НАУЧИТЬ БЕЗДУШНУЮ МАШИНУ ХОРОШО ИСКАТЬ ИЛИ
КАК НАУЧИТЬ БЕЗДУШНУЮ МАШИНУ ХОРОШО ИСКАТЬ Grebennikov Roman / / / Deep Refactoring / Voronezh / 2019 ndify.io @public_void_grv [email protected] 1

ПРО FINDIFY ПРО FINDIFY 2

ПРО FINDIFY ПРО FINDIFY white-label eCommerce SaaS search 2

ПРО FINDIFY ПРО FINDIFY white-label eCommerce SaaS search 1500 магазинов,
20M товаров 2

ПРО FINDIFY ПРО FINDIFY white-label eCommerce SaaS search 1500 магазинов,
20M товаров 50M посетителей в месяц 2

FINDIFY В ДАЛЕКОМ 2014 FINDIFY В ДАЛЕКОМ 2014 3

FINDIFY В ДАЛЕКОМ 2014 FINDIFY В ДАЛЕКОМ 2014 Плагин для
shopify, фокус на UI 3

shopify, фокус на UI Внутри ElasticSearch 3

shopify, фокус на UI Внутри ElasticSearch Ранжирование ES по-умолчанию 3

ВАЖНОСТЬ РАНЖИРОВАНИЯ ВАЖНОСТЬ РАНЖИРОВАНИЯ 4

ВАЖНОСТЬ РАНЖИРОВАНИЯ ВАЖНОСТЬ РАНЖИРОВАНИЯ никто не скроллит вниз 4

ВАЖНОСТЬ РАНЖИРОВАНИЯ ВАЖНОСТЬ РАНЖИРОВАНИЯ второго раза не будет 5

ВАЖНОСТЬ РАНЖИРОВАНИЯ ВАЖНОСТЬ РАНЖИРОВАНИЯ и завтра никто не вернется 6

ТИПИЧНАЯ СЕССИЯ ПОЛЬЗОВАТЕЛЯ ТИПИЧНАЯ СЕССИЯ ПОЛЬЗОВАТЕЛЯ 7

ТИПИЧНАЯ СЕССИЯ ПОЛЬЗОВАТЕЛЯ ТИПИЧНАЯ СЕССИЯ ПОЛЬЗОВАТЕЛЯ 1. Зашел на страницу
товара (0s) 7

товара (0s) 2. Куда-то тыкнул (+10s) 7

товара (0s) 2. Куда-то тыкнул (+10s) 3. Сделал поиск (+20s) 7

товара (0s) 2. Куда-то тыкнул (+10s) 3. Сделал поиск (+20s) 4. Ушел навсегда (+30s) 7

НАДО ЧТО-ТО МЕНЯТЬ НАДО ЧТО-ТО МЕНЯТЬ 8

МЕШН ЛЕРНИНГ! МЕШН ЛЕРНИНГ! 9

AI ML AI ML Algorithm Conversion AOV 11

AI ML AI ML Algorithm Conversion AOV Elasticsearch baseline baseline
11

AI ML AI ML Algorithm Conversion AOV Elasticsearch baseline baseline
Regression +3.1% +2.5% 11

НЕ ИЗОБРЕТАТЬ ВЕЛОСИПЕД НЕ ИЗОБРЕТАТЬ ВЕЛОСИПЕД 12

НЕ ИЗОБРЕТАТЬ ВЕЛОСИПЕД НЕ ИЗОБРЕТАТЬ ВЕЛОСИПЕД Learn to Rank 12

НЕ ИЗОБРЕТАТЬ ВЕЛОСИПЕД НЕ ИЗОБРЕТАТЬ ВЕЛОСИПЕД Learn to Rank RankBoost,
AdaRank, LambdaRank, LambdaMART 12

НЕ ИЗОБРЕТАТЬ ВЕЛОСИПЕД НЕ ИЗОБРЕТАТЬ ВЕЛОСИПЕД Learn to Rank RankBoost,
AdaRank, LambdaRank, LambdaMART XGBoost / LightGBM / CatBoost 12

LEARN TO ЧЁ? LEARN TO ЧЁ? или что не так
с регрессией 13

NDCG NDCG Normalized Discounted Cumulative Gain 14

RANKBOOST RANKBOOST 15

RANKBOOST RANKBOOST Засунуть NDCG как метрику в регрессию 15

RANKBOOST RANKBOOST Засунуть NDCG как метрику в регрессию Градиентным спуском
подобрать параметры 15

ADARANK ADARANK 16

ADARANK ADARANK Засунуть NDCG как метрику в регрессию (опять) 16

ADARANK ADARANK Засунуть NDCG как метрику в регрессию (опять) Аналитически
вычислить оптимальные параметры 16

LAMBDARANK LAMBDARANK 17

LAMBDARANK LAMBDARANK Нейросеть вместо регрессии 17

LAMBDARANK LAMBDARANK Нейросеть вместо регрессии Градиентным спуском подобрать параметры 17

LAMBDAMART LAMBDAMART 18

LAMBDAMART LAMBDAMART Нейросеть тормозит и сложна 18

LAMBDAMART LAMBDAMART Нейросеть тормозит и сложна Multiple Additive Regression Trees
18

LAMBDAMART LAMBDAMART Нейросеть тормозит и сложна Multiple Additive Regression Trees
Градиентным спуском подобрать параметры 18

ИНТЕГРАЦИЯ С ELASTICSEARCH ИНТЕГРАЦИЯ С ELASTICSEARCH ltr-плагин, обертка над xgboost
19

ИНТЕГРАЦИЯ С ELASTICSEARCH ИНТЕГРАЦИЯ С ELASTICSEARCH 21

ОБУЧЕНИЕ ОБУЧЕНИЕ 22

ОБУЧЕНИЕ ОБУЧЕНИЕ Исторические данные о поисках-кликах-покупках 22

ОБУЧЕНИЕ ОБУЧЕНИЕ Исторические данные о поисках-кликах-покупках Отдельная модель для каждого
магазина 22

ОБУЧЕНИЕ ОБУЧЕНИЕ Исторические данные о поисках-кликах-покупках Отдельная модель для каждого
магазина Цель - минимизация NDCG 22

ФИЧИ ФИЧИ поисковый запрос: # слов, # фильтров товар: цена,
# просмотров вариант: цвет, размер сессия пользователя: чувствительность к цене, # поисков профиль пользователя: # сессий запрос+товар: # просмотров в рамках запроса 23

ФИЧИ ФИЧИ поисковый запрос: # слов, # фильтров товар: цена,
# просмотров вариант: цвет, размер сессия пользователя: чувствительность к цене, # поисков профиль пользователя: # сессий запрос+товар: # просмотров в рамках запроса + на разных интервалах 23

ВЫШЛО ХОРОШО, НО НЕ ОЧЕНЬ ВЫШЛО ХОРОШО, НО НЕ ОЧЕНЬ
26

ВЫШЛО ХОРОШО, НО НЕ ОЧЕНЬ ВЫШЛО ХОРОШО, НО НЕ ОЧЕНЬ
Algorithm Conversion AOV Elasticsearch baseline baseline Regression +3.1% +2.5% LMART v1 +6.1% (+8.1%) no data 27

КОСЯКИ КОСЯКИ Исторические данные о поисках-кликах-покупках 28

КОСЯКИ КОСЯКИ Исторические данные о поисках-кликах-покупках Отдельная модель для каждого
магазина 28

КОСЯКИ КОСЯКИ Исторические данные о поисках-кликах-покупках Отдельная модель для каждого
магазина Цель - минимизация NDCG 28

ПОЛОЖИТЕЛЬНАЯ ОБРАТНАЯ СВЯЗЬ ПОЛОЖИТЕЛЬНАЯ ОБРАТНАЯ СВЯЗЬ 29

ПОЛОЖИТЕЛЬНАЯ ОБРАТНАЯ СВЯЗЬ ПОЛОЖИТЕЛЬНАЯ ОБРАТНАЯ СВЯЗЬ 30

POSITION POSITION 31

СЛУЧАЙНОЕ РАНЖИРОВАНИЕ СЛУЧАЙНОЕ РАНЖИРОВАНИЕ 32

СЛУЧАЙНОЕ РАНЖИРОВАНИЕ СЛУЧАЙНОЕ РАНЖИРОВАНИЕ Algorithm Conversion AOV Elasticsearch baseline baseline
Regression +3.1% +2.5% LMART v1 +6.1% (+8.1%) no data Random -2.8% -1.3% 33

POSITION BIAS POSITION BIAS L. Li, W. Chu, J. Langford,
R. Schapire. 2010. A contextual-bandit approach to personalized news article recommendation. 34

POSITION BIAS POSITION BIAS L. Li, W. Chu, J. Langford,
R. Schapire. 2010. A contextual-bandit approach to personalized news article recommendation. Два сегмента: exploration и exploitation убрать bias при обучении 34

EXPLORATION EXPLORATION 35

EXPLORATION EXPLORATION 0.1-1% всего трафика 35

EXPLORATION EXPLORATION 0.1-1% всего трафика первая страница результатов поиска перемешана
35

EXPLORATION EXPLORATION 0.1-1% всего трафика первая страница результатов поиска перемешана
используется для обучения 35

КОСЯКИ КОСЯКИ Исторические репрезентативные данные о поисках-кликах-покупках Отдельная модель для
каждого магазина Цель - минимизация NDCG 36

ОТДЕЛЬНАЯ МОДЕЛЬ ДЛЯ КАЖДОГО МАГАЗИНА ОТДЕЛЬНАЯ МОДЕЛЬ ДЛЯ КАЖДОГО МАГАЗИНА
37

Магазины с низким трафиком 37

Магазины с низким трафиком Время на онбординг и холодный старт 37

Магазины с низким трафиком Время на онбординг и холодный старт Отвратительное ранжирования для сегмента "Exploration" 37

ОДНАЖДЫ НА ХАКАТОНЕ ОДНАЖДЫ НА ХАКАТОНЕ 38

ОДНАЖДЫ НА ХАКАТОНЕ ОДНАЖДЫ НА ХАКАТОНЕ Заменить костыли на ML
для автокомплита 38

для автокомплита гораздо проще чем поиск 38

для автокомплита гораздо проще чем поиск все фичи зависят только от языка 38

для автокомплита гораздо проще чем поиск все фичи зависят только от языка три магазина для теста: S, M, XXL 38

РЕЗУЛЬТАТЫ? РЕЗУЛЬТАТЫ? 39

ПЕРЕСАДКА МОДЕЛИ ПЕРЕСАДКА МОДЕЛИ 40

ПЕРЕСАДКА МОДЕЛИ ПЕРЕСАДКА МОДЕЛИ из XXL магазина в S: 40

ОБОБЩЕННАЯ МОДЕЛЬ ОБОБЩЕННАЯ МОДЕЛЬ 41

ОБОБЩЕННАЯ МОДЕЛЬ ОБОБЩЕННАЯ МОДЕЛЬ Больще данных 41

ОБОБЩЕННАЯ МОДЕЛЬ ОБОБЩЕННАЯ МОДЕЛЬ Больще данных Лучшее покрытие необычных случаев
41

Не надо собирать данные для нового магазина 41

Не надо собирать данные для нового магазина Фичи нужно масштабировать 41

КОСЯКИ КОСЯКИ Исторические репрезентативные данные о поисках-кликах- покупках Отдельная Обобщенная
модель Цель - минимизация NDCG 42

NDCG NDCG 43

NDCG NDCG 1.0 - хорошо, 0.0 - плохо, 0.4-0.7 -
норм 43

норм сравнивает идеальное ранжирование с реальным 43

норм сравнивает идеальное ранжирование с реальным какое такое идеальное ранжирование? 43

ИДЕАЛЬНОЕ РАНЖИРОВАНИЕ ИДЕАЛЬНОЕ РАНЖИРОВАНИЕ 44

STANLEY BONG STANLEY BONG 45

STANLEY BONG STANLEY BONG Позиция в поиске поднялась с #20
до #1 45

до #1 Ни разу никто не купил 45

до #1 Ни разу никто не купил Стоит всего 3500$ 45

STANLEY BONG STANLEY BONG 46

STANLEY BONG STANLEY BONG пере-оптимизировали для кликов 46

ИДЕАЛЬНОЕ РАНЖИРОВАНИЕ ИДЕАЛЬНОЕ РАНЖИРОВАНИЕ 47

TRAINING ISSUES TRAINING ISSUES Исторические репрезентативные данные о поисках-кликах- покупках
Отдельная Обобщенная модель Цель - минимизация NDCG (с корректными весами!) 48

РЕЗУЛЬТАТЫ РЕЗУЛЬТАТЫ 49

NDCG WITH PERSONALIZATION NDCG WITH PERSONALIZATION Algorithm NDCG (of ine)
50

Random 0.544 50

Random 0.544 Popularity 0.578 50

Random 0.544 Popularity 0.578 Elasticsearch 0.601 50

Random 0.544 Popularity 0.578 Elasticsearch 0.601 Regression 0.615 50

Random 0.544 Popularity 0.578 Elasticsearch 0.601 Regression 0.615 LMART v1 ~0.621 50

Random 0.544 Popularity 0.578 Elasticsearch 0.601 Regression 0.615 LMART v1 ~0.621 LMART unbiased 0.635 50

NDCG AND BUSINESS METRICS NDCG AND BUSINESS METRICS Algorithm NDCG
CTR Conversion AOV 51

CTR Conversion AOV Elasticsearch 0.601 baseline baseline baseline 51

CTR Conversion AOV Elasticsearch 0.601 baseline baseline baseline Random 0.544 -7.1% -2.8% -1.3% 51

CTR Conversion AOV Elasticsearch 0.601 baseline baseline baseline Random 0.544 -7.1% -2.8% -1.3% Regression 0.615 -1.1% +3.1% +2.5% 51

CTR Conversion AOV Elasticsearch 0.601 baseline baseline baseline Random 0.544 -7.1% -2.8% -1.3% Regression 0.615 -1.1% +3.1% +2.5% LMART v1 ~0.621 no data +6.1% no data 51

CTR Conversion AOV Elasticsearch 0.601 baseline baseline baseline Random 0.544 -7.1% -2.8% -1.3% Regression 0.615 -1.1% +3.1% +2.5% LMART v1 ~0.621 no data +6.1% no data LMART unbiased 0.635 no data +8.1% (est) no data 51

ВЫВОДЫ ВЫВОДЫ 52

ВЫВОДЫ ВЫВОДЫ Лучше поиск - больше денег 52

ВЫВОДЫ ВЫВОДЫ Лучше поиск - больше денег Можно легко прострелить
ногу 52

ВЫВОДЫ ВЫВОДЫ Лучше поиск - больше денег Можно легко прострелить
ногу Умножьте оценку сроков на 52

Learn-to-Rank или как научить бездушную машину ...

Learn-to-Rank или как научить бездушную машину хорошо искать

More Decks by Deep Refactoring

Other Decks in Education

Featured

Transcript