об'єму даних (а також наявності, якості та ін.) • Підготовка навчального, тестового та контрольного набору • Підбір ML алгоритму • Навчання алгоритму • Підготовка необхідних артефактів (наборів правил, баз знань, тощо)
вхідні вимоги / різнорідні цілі Розбиття вимог – використовуємо стандартні типи завдань ML Оцінка та підготовка даних Великий об'єм даних Застосування сучасних технологій BigData / Cloud Оцінка та підготовка даних Малий об’єм даних Штучне «насичення» даних - генерація Оцінка та підготовка даних Неоднорідність вхідних даних Відображення на єдину вхідну модель із приведенням шкал Підбір ML алгоритму Великий час оцінювання алгоритмів Обмежуємо вхідний набір алгоритмів Використовуємо Cloud ресурси та інструментарій Підбір ML алгоритму Трудомісткий процес оцінювання Використовуємо Cloud ресурси та інструментарій Будуємо «Фабрику алгоритмів» Підбір ML алгоритму Не отримано необхідного рівня якості Підвищуємо «якість» даних Кращий features selection Будуємо «змішаний» алгоритм
спрацювань • Повнота – співвідношення якісних спрацювань до еталонної (реальної) кількості включень • Показник логарифмічних втрат – оцінка «ціни помилки», алгоритм скорінгу для коректних та некоректних спрацювань • Mean Absolute Error (MAE, алгоритми регресії) – оцінка абсолютної різниці між визначеними та еталонними показниками
бібліотеки та платформи – scikit, Mahout, OpenCV, Tesseract, TensorFlow, Spark • Спеціалізовані VM з набором ML tools • Готові cloud-платформи та АРІ – Azure ML Studio, Google Cloud Machine Learning, Amazon Machine Learning, Microsoft Cognitive Services, Wolfram|Alpha API
та знання в області математики / ML • Базовані на ML системи зазвичай динамічні та розподілені а • При реалізації важливими метриками є продуктивність та ефективність • Знання технологічних пакетів (та їх особливостей) так само важливе як вміння будувати алгоритми
data scientists та аналітиків до роботи з кодом • Максимальна орієнтація на досягнення цілей, а не на час реалізації • Використовуйте OS-рішення та industry standards технології • Але не бійтесь експериментувати де це доцільно • В рішенні важлива кінцева цінність, а не тільки внутрішня механіка