Upgrade to Pro — share decks privately, control downloads, hide ads and more …

How to develop an ML-project

How to develop an ML-project

У вас космически классная идея нового сервиса на минус 1 миллион долларов, которая должна во всю использовать машинное обучение да нейросети? Отлично! Срочно бежим расписывать фичи, планировать спринты и писать код. Но, внезапно, все фичи похожи на какие-то гипотезы, да на чтение статей или на нечто в стиле «понять как это работает и попробовать повторить». Прошел уже месяц, а на демо вы можете только сказать, что прочитали 50 классных статей на http://arxiv.org? Кстати, готовые библиотеки не работают, написаны на c++ и для запуска требуют компьютер автора. Что же делать и когда что-то пошло не так? Это ведь обычная разработка. Wait, oh shi~.
На докладе разберем, как происходила разработка ML проекта. Проекта, где нельзя сразу сесть и начать кодить, запиливая фичи. Каким образом вести работу в таком Research&Development проекте мы и узнаем на докладе.

Ilya Siganov

October 06, 2018
Tweet

More Decks by Ilya Siganov

Other Decks in Education

Transcript

  1. Фаза 1. Поиск себя • На каждую статью - задача

    в gitlab • Все материалы в raindrop с тегами • На интересные статьи пишем конспект • Ищем всё про прически ◦ 3D модели ◦ Сегментация причесок ◦ Моделирование причесок ◦ Интерполяция прически - GAN модели
  2. Фаза 1. Поиск себя. Результат • На демо - результаты

    обзора статей • Что делать - не ясно • Писать конспекты - долго и зачем? если очередная статья всё меняет • Писать ежедневные отчеты - очень полезно
  3. Фаза 2. Поиск осязаемого • Нужны не статьи, а КОД,

    который работает • Нужны предобученные модели • Анализ подобных приложений (FaceApp, MRRMRR….) • Поиск датасетов Нужно делать интерполяцию причесок!
  4. Фаза 3. Аниме • Учимся запускать GAN модели • Синтезируем

    аниме, фасады зданий • ОНО РАБОТАЕТ! • непонятно как… • скрейпинг датасетов аниме
  5. Уже конец июля! • Ради дозы дофамина выпустили стикеры •

    Почему-то решили генерировать лица (wat?) • вера в магический ConVAEGAN
  6. Бонус - это понимание • Как работает auto encoder •

    Как работает VAE • Что такое GAN • Изучали Conditional VAEGAN
  7. Фаза 7. Разворот • Зачем синтезировать прически? • Зачем синтезировать

    лица? • Зачем делать интерполяцию волос? • Зачем искать латентное представление фото?
  8. Фаза 7. Разворот • Скрейпим google images по 28 категориям

    • Простой face-detection и face-crop • Простой face-swap по лендмаркам • Face-segmentation • Background-segmentation • Упаковываем вк бота • ????
  9. Фаза 8. Восхождение • 60 бета-тестеров в вк • стенд

    на HappyDev-lite • Куча смешных результатов • Людям почему-то нравится
  10. Фаза 9. Улучшение Следующий релиз в начале ноября • полное

    3D-копирование лица • точная сегментация волос • меньше искажений
  11. Выводы • Лучше проще, но сразу • Лучше улучшать плохое,

    чем делать сразу круто • Делать стикерпаки, вести ML Glitch Art полезно • Писать отчеты каждый день - очень важно • Делать недельные планы - очень полезно • Не затягивать research фазу, лучше дробить разработкой • GPU не нужны, если нет идей • Складировать все ссылки - полезно • Общаться с другими людьми, кто не в теме - очень полезно! • Студентам надо давать более четкие задачи
  12. Крутые методы • Ежедневные подробные отчёты по почте • Складирование

    ссылок с тегами • Недельный план ресерча на доске • Недельные логи по результатам работы • Искать на гитхабе • Скотч, пластыри и в продакшен.