что данные собранные таким образом ненадежны. Платформа для тестирования должна содержать: • Предопределенные метрики теста • Инструментарий анализа “силы” теста • Предэкспериментальное A/A тестирование 23
are totally wrong” John P. A. Ioannidis “Why Most Published Research Findings Are False”, 2005 https:// www.ncbi.nlm.nih.gov/pmc/articles/PMC1182327/ 35
are totally wrong” John P. A. Ioannidis “Why Most Published Research Findings Are False”, 2005 https:// www.ncbi.nlm.nih.gov/pmc/articles/PMC1182327/ Люди склонны находить некий смысл в результатах теста вне изначальной гипотезы. 36
лишь дело времени и усилий. Возможно найти значительные отклонения в абсолютно любом тесте, но следует ли?... Из 1.000 “placebo” тестов: • 771 эксперимент достиг 90% значимости • 531 эксперимент достиг 95% значимости 39
оптимальный период тестирования • Следуйте своей гипотезе • Определите наименьший эффект воздействия • Не пытайтесь обмануть данные • Если вы ожидаете, что ничего не изменится - то сила теста равна 0 45
оптимальный период тестирования • Следуйте своей гипотезе • Определите наименьший эффект воздействия • Не пытайтесь обмануть данные • Если вы ожидаете, что ничего не изменится - то сила теста равна 0 • Ошибки I и II типов 46
statistical ghosts? 1. The evolution of continuous experimentation 1. Using multivariant tests to determine performance impact 1. Sequential Testing and Equivalence Testing 61