Применение Machine Learning в проектах

https://byndyusoft.com Применение Machine Learning в проектах Процесс, особенности, риски

End-to-end ML workflow Get data Prepare data Train model Evaluate
model Problem statement MVP Solution development Test & Integrate Serving Monitoring & Logging Start

Начало проекта Постановка задачи, MVP

Постановка задачи / MVP Или с чего все обычно начинается
1. Определяем метрики, технические ограничения. 2. Определяем способ решения. 3. Создаем первую реализацию, оцениваем метрики. 4. Оцениваем риски. 5. Понимаем во сколько оценить задачу.

Подробнее об оценке Или почему оценку стоит умножить на 9!
Основные моменты, на которые необходимо обратить внимание: • Наличие данных у заказчика, их качество. • Платформа, на которой мы запустим решение. • Требования по точности и производительности. • Наличие примеров реализации похожих задач. • Наличие наработок с нашей стороны. • Требования к железу для разработки. • Инфраструктура. • Ожидания заказчика, сопротивление внедрению

У нас было несколько датасетов, ограниченный бюджет, пару пайплайнов и
согласованные метрики... Начинаем обучение

Понятие эксперимента Эксперимент — процедура проверки и опровержения гипотез. У
эксперимента есть цель, план, критерии принятия или опровержения гипотез, данные и ожидаемые результаты. Эксперимент, разбитый на этапы, с указанием последовательности исполнения, называется пайплайном.

Обучение Основные этапы и инструменты Под обучением понимаем запуски пайплайнов
для проверки различных гипотез в поисках лучшего решения поставленной задачи. Этапы: 1. Получаем данные. 2. Подготавливаем данные. 3. Обучаем. 4. Валидируем. Все просто и понятно, но...

Основные требования к пайплайну и проведению экспериментов Или как испортить
все с самого начала Хорошая практика: запуск пайплайна — проверка одной гипотезы иначе не определить влияние на результат. И самое главное — эксперименты воспроизводимы, пайплайн покрыт тестами... ...и data scientist, понимающий как разрабатываемое решение принесет пользу заказчику.

Воспроизводимость Что это и почему так важно Под воспроизводимостью понимаем
достижение решением текущих метрик при повторении всех предыдущих шагов. Воспроизводимость — основное требование эксперимента и одна из основ научного метода познания. “non-reproducible single occurrences are of no significance to science” - Карл Поппер, Логика научного исследования, 1959

Воспроизводимость Достигается за счет: 1. Автоматизации пайплайна. 2. Сохранения всех
экспериментов: артефакты, конфиги, параметры запуска. 3. Отслеживания последовательности запусков. 4. Версионирования пайплайна и данных. 5. Версионирования артефактов. 6. Контроля окружения. 7. Начальной инициализации слоев, генераторов случайных чисел, алгоритмов и т.д. Инструменты: DVC, MLflow, Docker.

Тесты Покрываем тестами пайплайн. Ошибки в расчете метрик, аугментации, обработке
данных не позволяют выстроить процесс инкрементного улучшения метрик решения.

Переносим решение на целевую платформу Играем в ML инженера

Деплоим на целевую платформу Или почему обучение не самый долгий
этап Требование к пайплайну — удобство R&D. Требование к коду для Production — скорость при имеющихся ресурсах. Поэтому часто все этапы решения переносятся на другой фреймворк, который будет использоваться для запуска на целевой платформе.

Деплоим на целевую платформу На что обратить внимание при разработке:
1. Отсутствие соответствия вывода алгоритмов на разных фреймворках — тесты на бинарное соответствие. 2. Фреймворк не содержит реализации используемых слоев, функций и т.д. — предусмотреть до обучения как и на чем будем запускать/оценить время на написание собственных реализаций. 3. Версии библиотек, фреймворков — до обучения проверить, какая версия доступна на платформе и использовать ее.

Выкатываем в production “...но на наших же данных оно работало…”

Выкатываем в production Цель данного этапа — зарелизить и не
потерять доверие заказчика к решению. Основные меры для снижения рисков до релиза: - Unit тесты + тесты на бинарное соответствие. - Валидация на тестовых данных перед выкаткой. Меры после релиза: - мониторинг: ресурсы, производительность, валидация выдаваемых значений (если возможно). - валидирование вручную результатов, оценка корректности работы - смотрим в данные и результаты.

И немного про CI/CD Примеряем роль MLOps`а Основные трудности: -
Разнообразие платформ и подходов. - Зависимости от сторонних библиотек. - Версионирование, хранение артефактов. - Тесты, валидация. - Аппаратные зависимости.

Итоги Отложим в сторону ML, поговорим о нас

Проблема доверия «Не верю!» Доверие заказчика к решению надо заслужить
и поддерживать: • Работа с ожиданиями • Прозрачность • Предсказуемость • Готовность к изменениям мира

Как упростить жизнь Ничего нового 1. Постараться учесть все в
оценке. 2. Поддерживать прозрачность. 3. Управлять рисками. 4. Копить знания.

https://byndyusoft.com Спасибо! Мы сделали это вместе

Применение Machine Learning в проектах

Применение Machine Learning в проектах

Бындюсофт

More Decks by Бындюсофт

Other Decks in Technology

Featured

Transcript

https://byndyusoft.com Применение Machine Learning в проектах Процесс, особенности, риски

End-to-end ML workflow Get data Prepare data Train model Evaluate

Начало проекта Постановка задачи, MVP

Постановка задачи / MVP Или с чего все обычно начинается

Подробнее об оценке Или почему оценку стоит умножить на 9!

У нас было несколько датасетов, ограниченный бюджет, пару пайплайнов и

Понятие эксперимента Эксперимент — процедура проверки и опровержения гипотез. У

Обучение Основные этапы и инструменты Под обучением понимаем запуски пайплайнов

Основные требования к пайплайну и проведению экспериментов Или как испортить

Воспроизводимость Что это и почему так важно Под воспроизводимостью понимаем

Воспроизводимость Достигается за счет: 1. Автоматизации пайплайна. 2. Сохранения всех

Тесты Покрываем тестами пайплайн. Ошибки в расчете метрик, аугментации, обработке

Переносим решение на целевую платформу Играем в ML инженера

Деплоим на целевую платформу Или почему обучение не самый долгий

Деплоим на целевую платформу На что обратить внимание при разработке:

Выкатываем в production “...но на наших же данных оно работало…”

Выкатываем в production Цель данного этапа — зарелизить и не

И немного про CI/CD Примеряем роль MLOps`а Основные трудности: -

Итоги Отложим в сторону ML, поговорим о нас

Проблема доверия «Не верю!» Доверие заказчика к решению надо заслужить

Как упростить жизнь Ничего нового 1. Постараться учесть все в

https://byndyusoft.com Спасибо! Мы сделали это вместе