Гео-тесты: инструкция по применению

Геотесты: инструкция по применению Иван Уваров Product analyst

Есть решение!

Разновидность квази-экспериментов, в котором в качестве юнита разбиения выступает географический
объект (город, область и т.д.) Что такое геотест?

Разновидность квази-экспериментов, в котором в качестве юнита разбиения выступает географический
объект (город, область и т.д.) Зачем он нужен, если есть обычные A/B-тесты? 1) Юридические ограничения 2) Сетевые эффекты 3) Изменения, которые тяжело раскатить на конкретных пользователей Что такое геотест?

На какие этапы нужно обратить особое внимание при работе с
геотестами Дизайн Разбиение на группы: мэтчинг, стратифицированное сэмплирование 01 Самая главная проблема: малый объем выборки

На какие этапы нужно обратить особое внимание при анализе геотестов
Дизайн Разбиение на группы: мэтчинг, стратифицированное сэмплирование Анализ результатов Увеличение чувствительности 01 02

На какие этапы нужно обратить особое внимание при анализе геотестов
Дизайн Разбиение на группы: мэтчинг, стратифицированное сэмплирование 01

Задача Раскатили в 3 городах фичу/произвели изменение. Нужно измерить получившийся
эффект. #1

Совокупность методов для сопоставления друг с другом различных объектов. В
тестовой группе будут наблюдения, в которых произошло какое-либо изменение, в контрольной – где все осталось как прежде. Мэтчинг

Мера близости групп

1. MAE Мера близости групп

1. MAE 2. Дисперсия отношения Корреляция Мера близости групп

Формируем тестовую и пустую контрольные группы d Тестовая группа Контрольная
группа Оставшиеся города 2 1 3 4 5 6 7 8 9

Прибавляем один город d Тестовая группа Контрольная группа Оставшиеся города
2 1 3 4 5 6 7 8 9

Прибавляем пару городов d Тестовая группа Контрольная группа Оставшиеся города
2 1 3 4 5 6 7 9 8

Убираем один город d Тестовая группа Контрольная группа Оставшиеся города
2 1 3 4 5 6 7 9 8

Как устроен мэтчинг Выделяем тестовую и пустое множество контрольной группы
Прибавляем один город Прибавляем пару городов Убираем один город Повторяем этот цикл до тех пор, пока мера близости групп не перестает меняться

Подведение результатов 1. Нужно провести серию АА тестов. На исторических
данных выделяем обучающую и валидационную выборки

данных выделяем обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов

данных выделяем обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов 3. На обучающей выборке проводим мэтчинг

данных выделяем обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов 3. На обучающей выборке проводим мэтчинг 4. На валидационной выборке смотрим на отношение теста к контролю

данных выделяем обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов 3. На обучающей выборке проводим мэтчинг 4. На валидационной выборке смотрим на отношение теста к контролю 5. Повторяем шаги 2-4 n раз (100, 1000) и получаем распределение отношений

1. Нужно провести серию АА тестов. На исторических данных выделяем
обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов 3. На обучающей выборке проводим мэтчинг 4. На валидационной выборке смотрим на отношение теста к контролю 5. Повторяем шаги 2-4 n раз (100, 1000) и получаем распределение отношений 6. Выделяем области распределения, выход за которые будем считать прокрасом Подведение результатов

Хотим произвести изменение, например, реклама на билбордах, по всей стране.
Хотим понять, как измерить эффект от этого изменения. Задача #2

Стратифицированное сэмплирование 1 10 12 2 4 6 7 8
11 3 5 9 2 10 8 5 Sample Population

Стратифицированное сэмплирование 1 10 12 2 4 6 7 8
11 3 5 9 2 10 8 5 Sample Population Разбивать города на страты будем с помощью алгоритма kmeans

Кластер 1 Кластер 2 Кластер 3 Множество всех городов m1,
m2, m3, m4, m5 Разбиение на 3 кластера, по 5 метрикам

Кластер 1 Кластер 2 Кластер 3 1 1 1 1
1 1 2 2 2 2 3 3 3 3 Тест Контроль

1 1 2 2 2 2 3 3 3 3 Тест Контроль 50% 50% Достаем рандомно по 50% из каждого кластера в тестовую и контрольную группы

1 1 2 2 Тест Контроль 2 2 3 3 3 3 Считаем p-value для каждой метрики Производим n(100, 1000) симуляций формирования тестовых и контрольных групп Считаем процент прокрассов по каждой метрике

Саммари алгоритма разбиения на кластеры Задаем количество кластеров, метрики

Задаем количество кластеров, метрики Формируем кластера, из них n раз
(например 100/1000) формируем тест/контроль Саммари алгоритма разбиения на кластеры

(например 100/1000) формируем тест/контроль Считаем процент прокрасов по каждой метрике Саммари алгоритма разбиения на кластеры

(например 100/1000) формируем тест/контроль Считаем процент прокрасов по каждой метрике Повторяем для всевозможных сочетаний метрик и количества кластеров Саммари алгоритма разбиения на кластеры

(например 100/1000) формируем тест/контроль Считаем процент прокрасов по каждой метрике Выбираем наилучшее разбиение по min среднему проценту прокраса по метрикам Повторяем для всевозможных сочетаний метрик и количества кластеров Саммари алгоритма разбиения на кластеры

1. Cuped 2. Прокси метрики 3. Работа над качеством данных
Как можем ускорить принятие решения?

Какие еще есть способы? 1. Другие алгоритмы мэтчинга 2. Методы
создания синтетического контроля (Causal Impact)

Внимательно относимся к формированию тестовых и контрольных групп, на откуп
рандому отдать не получится. Поскольку юнитов в выборках будет мало, нужно не забывать про методы увеличения чувствительности. Если у вас нет проблем, которые перечислены в начале доклада – лучше делать классические АБ :) Итого

Спасибо!

Гео-тесты: инструкция по применению

Гео-тесты: инструкция по применению

More Decks by Zhanna

Featured

Transcript