системы и видят разные цифры • Интеграции аналитики не совпадают в портфолио и не обновляются • Бесконечный ручной труд по очистке и поиску одних и тех же ответов • Отсутствие системного подхода 2=5 Итог: принятие важных решений невозможно в срок
KPI ◦ Метрики невозможно сопоставить ◦ Не видны все интересующие срезы • Без ad-hoc запроса невозможно узнать улучшился/ухудшился трафик или продукт ◦ Зависимость от внешних систем Было
сравниваются, очищаются • Стандартизация: все отчёты стандартны, по всем проектам/источникам смотрятся в единой BI системе Стало Итог: данным можно доверять, метрики можно сравнивать
с уже испорченными данными Интеграции аналитики: ◦ “Средненькая” интеграция может терять данные о ~30% пользователях – которые не пройдут далеко в игру ◦ Выпуск функционала без покрытия событиями Как итог: некачественные данные, очищать которые нужно дольше, чем использовать, а часто и невозможность заново повторить эксперимент
• Качество: автоматическая проверка версии с обнаружением новых/потерянных событий • Стандартизация: единое SDK, события собираются и отдаются одинаково
качества ◦ Скорость добавления новых отчётов • Поддержка нескольких технологических стеков в одном окружении с одними данными, включая python Business Intelligence система
API Gateway Hot Storage Amazon Lambda Machine Learning EVENTS Metabase Tableau Jupyter Slack • Conversions • Audiences • Etc. Data Warehouse Data Lake 1. Managed сервисы 2. Бесконечное скалирование и отказоустойчивость 3. Фокус на продукт, а не инфраструктуру - Ну и схема! - Фоткай скорей!
и требует развития • Системность во всех сферах аналитики • Причины, по которым вы зашли в тупик: данные не сходятся, понять успешность улучшений/аб занимает очень долго, каждый пересчет дает другие цифры Key takeaways