Slide 1

Slide 1 text

Как повысить конверсию с помощью умной сортировки выдачи? Евгений Шнейдерман Павел Михайлов Артем Богачев Декабрь 2017

Slide 2

Slide 2 text

Об Ostrovok.ru 2 ● Крупнейший российский сервис бронирования отелей ● 950 000 объектов размещения по всему миру ● Российский бренд Ostrovok.ru, международные - Zenhotels.com и Ratehawk.com ● Более 400 сотрудников ● Команда аналитики 18 человек

Slide 3

Slide 3 text

Содержание Что такое сортировка выдачи? Подходы к сортировке Внедрение новой сортировки и оценка результатов Инфраструктура и команда 1 2 3 4 3

Slide 4

Slide 4 text

Что такое сортировка выдачи?

Slide 5

Slide 5 text

5

Slide 6

Slide 6 text

Объект и цель исследования Mainpage SERP Hotel Page Booking Form Voucher Основная посадочная страница сайта Список объектов размещения, отсортированный для оптимизации целевых показателей Страница отеля (фотографии, отзывы, описания, карточки номеров) Ввод данных гостей, пожеланий, оплата Подтверждение успешного бронирования - цель воронки Объект исследования Целевые показатели: 1) Оптимизация конверсии SERP => Voucher 2) Оптимизация выручки 6

Slide 7

Slide 7 text

Важность качества сортировки 34% кликов приходятся на первый отель на SERPе 622 отелей доступно в среднем на SERPе крупного города 82% выручки зарабатывают первые 10 отелей в выдаче 7

Slide 8

Slide 8 text

Это значит... Лучше отели в Top-10 8 Выше конверсия и больше выручка

Slide 9

Slide 9 text

Как это сделать? Подходы к сортировке (разбираем матчасть)

Slide 10

Slide 10 text

Подходы к сортировке 10 Поотельный (pointwise) Score = XX По-парный (pairwise) > Списковый (listwise)

Slide 11

Slide 11 text

Поотельный подход Мы должны присвоить каждому отелю число (score), а потом просто отсортировать по нему НО… Что это должно быть за число? Конверсия? Рейтинг? Комиссия? Релевантность? CTR? 11 Качество контента?

Slide 12

Slide 12 text

Выбор скора: моделируем поведение 12 Hotel Page SERP Voucher Commission CTR Conversion Margin В идеальном мире мы хотим учитывать в скоринге все три показателя: CPD (Commission per Display) Однако в реальности для качественного скоринга на основании всех трех, нужно иметь данные для их оценки по каждому отелю 1X 1X 250X 1000X Data points

Slide 13

Slide 13 text

Выбор скора: CPV 13 Hotel Page SERP Voucher Commission CTR Conversion Margin CPV model CPV (commission per visit) – сумма комиссии в расчете на один визит + оптимизирует важную бизнес метрику $ + легко считается (комиссия / визиты) - не учитывает поведение на SERPе - данных мало, цифры требуют сглаживания - отстает от тренда - “богатые становятся богаче”

Slide 14

Slide 14 text

Выбор скора: SCNV 14 Hotel Page SERP Voucher Commission CTR Conversion Margin SCNV model SCNV% (serp conversion) – конверсия с СЕРПа на ваучер + учитывается СЕРПовая динамика + намного больше данных + намного выше скорость обновления - не учитывает деньги - “богатые становятся богаче”

Slide 15

Slide 15 text

SCNV + Bandit 15 CTR% CNV% × = Решение: дать отелям с малым объемом данных шанс оказаться наверху и набрать их

Slide 16

Slide 16 text

16 SCNV + Bandit: проблема новичков Чем больше у отеля данных, тем точнее скор выдает ему бандит Но у новых отелей нет данных Т.е. для новых отелей бандит всегда будет выдавать случайные оценки

Slide 17

Slide 17 text

17 SCNV + Bandit + приорные оценки Выдаем каждому отелю приорную оценку: - берем среднее распределение по группе отеля (регион, звездность) - обучаем модель предсказания распределения на основании характеристик отеля

Slide 18

Slide 18 text

Внедрение новой сортировки и оценка результатов

Slide 19

Slide 19 text

● Две группы: тест (бандит) и контроль (CPV model) ● Только новые пользователи, посещавшие SERP ● Первые 7 дней после запуска отпускаем на обучение модели ● Анализируем цифры за 21 день ● Замеряем конверсию и выручку ● Для целей анализа результатов игнорируем двойные бронирования и выбросы Описание AB теста 19

Slide 20

Slide 20 text

Результаты 20 +11,2% Конверсия SERP => Voucher 0% SERP CTR +6,7% Выручка Выводы: ● Тестовая группа выиграла ● Прирост конверсии произошел за счет более дешевых предложений ● Пользователи НЕ начали кликать больше, они стали кликать на то, что им нужно

Slide 21

Slide 21 text

Изменение сортировки (Москва) Оказалось, новая логика сортировки выявила склонность пользователей бронировать отели в более дешевой ценовой категории 21

Slide 22

Slide 22 text

Новая логика помогла нам справиться и с другой проблемой - отсутствием доступности после перехода с SERPa Включение этой метрики в поотельные скоры уменьшило долю ошибок почти в два раза Эффект на метрики доступности 22

Slide 23

Slide 23 text

23 Однако были и эксцессы..

Slide 24

Slide 24 text

Результаты: выручка по каналам Оказалось, результаты эксперимента существенно отличаются для разных типов трафика Это объясняется существенной разницей в пользовательском поведении для разного трафика 24

Slide 25

Slide 25 text

● Раздельная сортировка для разных каналов ● Добавление комиссии в расчет сортировки ● Внедрение “диверсификации” первых позиций ● Использование более сложных моделей (Pairwise, Listwise) Следующие шаги 25

Slide 26

Slide 26 text

Инфраструктура и команда

Slide 27

Slide 27 text

Client devices Дисплеи, клики, переходы Логи событий в сыром виде Backend Данные аггрегируются и раскладываются по ключам в HBase Отсорти- рованные списки Инфраструктура Финальный список отдается клиенту 27

Slide 28

Slide 28 text

Мониторинг и аналитика Backend Дисплеи, клики, переходы, финальные списки выдачи Успешные бронирования Дашборды SQL 28

Slide 29

Slide 29 text

Команда Успешная реализация и развитие подобного проекта требует обязательного присутствия следующих ролей в команде Data Scientist Data Analyst Project Manager Visioner 29

Slide 30

Slide 30 text

Contacts Евгений Шнейдерман Head of Analytics Ostrovok.ru [email protected] evgeny.shneyderman