Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Гео-тесты: инструкция по применению

Zhanna
July 09, 2024
1.1k

Гео-тесты: инструкция по применению

Zhanna

July 09, 2024
Tweet

More Decks by Zhanna

Transcript

  1. Разновидность квази-экспериментов, в котором в качестве юнита разбиения выступает географический

    объект (город, область и т.д.) Зачем он нужен, если есть обычные A/B-тесты? 1) Юридические ограничения 2) Сетевые эффекты 3) Изменения, которые тяжело раскатить на конкретных пользователей Что такое геотест?
  2. На какие этапы нужно обратить особое внимание при работе с

    геотестами Дизайн Разбиение на группы: мэтчинг, стратифицированное сэмплирование 01 Самая главная проблема: малый объем выборки
  3. На какие этапы нужно обратить особое внимание при анализе геотестов

    Дизайн Разбиение на группы: мэтчинг, стратифицированное сэмплирование Анализ результатов Увеличение чувствительности 01 02
  4. На какие этапы нужно обратить особое внимание при анализе геотестов

    Дизайн Разбиение на группы: мэтчинг, стратифицированное сэмплирование 01
  5. Совокупность методов для сопоставления друг с другом различных объектов. В

    тестовой группе будут наблюдения, в которых произошло какое-либо изменение, в контрольной – где все осталось как прежде. Мэтчинг
  6. Как устроен мэтчинг Выделяем тестовую и пустое множество контрольной группы

    Прибавляем один город Прибавляем пару городов Убираем один город Повторяем этот цикл до тех пор, пока мера близости групп не перестает меняться
  7. Подведение результатов 1. Нужно провести серию АА тестов. На исторических

    данных выделяем обучающую и валидационную выборки
  8. Подведение результатов 1. Нужно провести серию АА тестов. На исторических

    данных выделяем обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов
  9. Подведение результатов 1. Нужно провести серию АА тестов. На исторических

    данных выделяем обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов 3. На обучающей выборке проводим мэтчинг
  10. Подведение результатов 1. Нужно провести серию АА тестов. На исторических

    данных выделяем обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов 3. На обучающей выборке проводим мэтчинг 4. На валидационной выборке смотрим на отношение теста к контролю
  11. Подведение результатов 1. Нужно провести серию АА тестов. На исторических

    данных выделяем обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов 3. На обучающей выборке проводим мэтчинг 4. На валидационной выборке смотрим на отношение теста к контролю 5. Повторяем шаги 2-4 n раз (100, 1000) и получаем распределение отношений
  12. 1. Нужно провести серию АА тестов. На исторических данных выделяем

    обучающую и валидационную выборки 2. Выбираем n рандомных тестовых городов 3. На обучающей выборке проводим мэтчинг 4. На валидационной выборке смотрим на отношение теста к контролю 5. Повторяем шаги 2-4 n раз (100, 1000) и получаем распределение отношений 6. Выделяем области распределения, выход за которые будем считать прокрасом Подведение результатов
  13. Хотим произвести изменение, например, реклама на билбордах, по всей стране.

    Хотим понять, как измерить эффект от этого изменения. Задача #2
  14. Стратифицированное сэмплирование 1 10 12 2 4 6 7 8

    11 3 5 9 2 10 8 5 Sample Population Разбивать города на страты будем с помощью алгоритма kmeans
  15. Кластер 1 Кластер 2 Кластер 3 Множество всех городов m1,

    m2, m3, m4, m5 Разбиение на 3 кластера, по 5 метрикам
  16. Кластер 1 Кластер 2 Кластер 3 1 1 1 1

    1 1 2 2 2 2 3 3 3 3 Тест Контроль
  17. Кластер 1 Кластер 2 Кластер 3 1 1 1 1

    1 1 2 2 2 2 3 3 3 3 Тест Контроль 50% 50% Достаем рандомно по 50% из каждого кластера в тестовую и контрольную группы
  18. Кластер 1 Кластер 2 Кластер 3 1 1 1 1

    1 1 2 2 Тест Контроль 2 2 3 3 3 3 Считаем p-value для каждой метрики Производим n(100, 1000) симуляций формирования тестовых и контрольных групп Считаем процент прокрассов по каждой метрике
  19. Задаем количество кластеров, метрики Формируем кластера, из них n раз

    (например 100/1000) формируем тест/контроль Саммари алгоритма разбиения на кластеры
  20. Задаем количество кластеров, метрики Формируем кластера, из них n раз

    (например 100/1000) формируем тест/контроль Считаем процент прокрасов по каждой метрике Саммари алгоритма разбиения на кластеры
  21. Задаем количество кластеров, метрики Формируем кластера, из них n раз

    (например 100/1000) формируем тест/контроль Считаем процент прокрасов по каждой метрике Повторяем для всевозможных сочетаний метрик и количества кластеров Саммари алгоритма разбиения на кластеры
  22. Задаем количество кластеров, метрики Формируем кластера, из них n раз

    (например 100/1000) формируем тест/контроль Считаем процент прокрасов по каждой метрике Выбираем наилучшее разбиение по min среднему проценту прокраса по метрикам Повторяем для всевозможных сочетаний метрик и количества кластеров Саммари алгоритма разбиения на кластеры
  23. 1. Cuped 2. Прокси метрики 3. Работа над качеством данных

    Как можем ускорить принятие решения?
  24. Какие еще есть способы? 1. Другие алгоритмы мэтчинга 2. Методы

    создания синтетического контроля (Causal Impact)
  25. Внимательно относимся к формированию тестовых и контрольных групп, на откуп

    рандому отдать не получится. Поскольку юнитов в выборках будет мало, нужно не забывать про методы увеличения чувствительности. Если у вас нет проблем, которые перечислены в начале доклада – лучше делать классические АБ :) Итого