Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CodeFest 2018. Алексей Натёкин (Open Data Science, Arktur, DM Labs) — Откуда вырос и куда растет Data Science?

16b6c87229eaf58768d25ed7b2bbbf52?s=47 CodeFest
April 05, 2018

CodeFest 2018. Алексей Натёкин (Open Data Science, Arktur, DM Labs) — Откуда вырос и куда растет Data Science?

Посмотрите выступление Алексея: https://2018.codefest.ru/lecture/1309/

Мы часто слышим про разные успехи не то Data Science с Machine Learning, не то AI или вообще Big Data. Но что это вообще такое? Эти вещи как-то связаны? Что вообще происходит? Попробуем разобраться.

Уровень
Общий, формул не ожидается, развлекательные вещи присутствуют

16b6c87229eaf58768d25ed7b2bbbf52?s=128

CodeFest

April 05, 2018
Tweet

More Decks by CodeFest

Other Decks in Programming

Transcript

  1. Откуда вырос и куда растет Data Science? Алексей Натекин
 CodeFest,

    1 апреля 2018
  2. 7

  3. ИНФОРМАЦИЯ 2011 2012 2013 2014 2015 2016 2017 2010 2009

    2008 DM Labs Алексей Натекин 2018
  4. 2011 2012 2013 2014 2015 2016 2017 2010 2009 2008

    2018 Data Mining Big Data Data Science AI + cognitive хз что + machine intelligence + any other stuff
  5. Заметность 
 Время 1. запуск технологии 2. пик завышенных ожиданий

    3. пропасть разочарований 4. плато продуктивности 2014 2015 2013
  6. Data Science и Machine Learning 
 — следующие “Big Data”?

  7. Data [driven] Science:
 ‣“The art of turning data into actions”

    ‣“Interdisciplinary field about scientific methods, processes and systems to extract knowledge or insights from data in various forms” ‣“A newly emerging field dedicated to analyzing and manipulating data to derive insights and build data products”
  8. Сколько Data Science лет?

  9. “Department of Statistics and Data Science” @Yale Applications Computation Mathematics

  10. None
  11. Applications Computation Mathematics

  12. None
  13. Алан Тьюринг, 1950 Фрэнк Розенблатт, 1958 “Искусственный Интеллект”

  14. “Зима ИИ” AI: Экспертные системы:

  15. + KDD: Knowledge 
 Discovery (in) Databases Развитие Machine Learning

    “Отстаньте от нас, мы не AI, у нас все четко и научно, без философии”
  16. + Data Mining = 
 Датасеты непонятной фигни (привет интернет)

    + 
 Machine Learning • Statistical learning школа • Развитие PGM • SVM vs NN
  17. 2007-2013: Big Data и Hadoop

  18. Процент ошибок распознавания 2016 2010 Результат человека Алгоритмы глубокого обучения

    2010-2016: Deep Learning (бирка AI)
  19. None
  20. Сколько Data Science лет?
 ‣Термин придумали в 60-ых. Вспомнили и

    начали форсить с 2008-го, как общую бирочку. Всем зашло. ‣Ранее Data Mining. Ранее KDD. Ранее Статистика.
 Моделирование и Machine Learning — all inclusive. 
 
 
 P.S. Big Data - неудачный “бизнесовый” ребрендинг. 
 P.P.S. AI - очередная попытка такого ребрендинга.
  21. None
  22. Что делают Data Scientist-ы?

  23. “A data scientist is someone who is better at statistics

    than any software engineer and better at software engineering than any statistician.”
  24. Statistics
 Data Mining Сюда же:,
 этика и безопасность AI, философия

    сильного ИИ и сверх-сильного ИИ, аватары, … Сюда же: визуализация,
 теория принятия решений, специфичные подобласти (эконометрика++), оптимизация, … Data Science AI Machine
 Learning Big Data
 HPC
  25. Applications Computation Mathematics Domain & business expertise Programming & data

    engineering Statistics and machine learning (ML) research scientists Data 
 scientist
  26. Applications Computation Mathematics Domain & business expertise Programming & data

    engineering Statistics and machine learning Business & data analysts (Big) Data engineers (ML) research scientists Data 
 scientist
  27. Куда идет Data Science?

  28. Что ждет Data Science?
 ‣То же самое, что и с

    Computer Science в 90-ых. ‣Взросление. Процессы, инструменты, best practices. Сейчас у нас колхоз. ‣Область идет в массы. Компьютерная грамотность 2.0. Мы уже пошли по школам РФ. ‣Спрос на специалистов и их работу будет расти.
  29. Грядет новая “бирочка”:
 ‣Точно появится в ближайшие 2-3 года, к

    2020-му. ‣Бирку AI уберут в шкаф еще лет на 10. Хайпанули и можно честь знать (см. Big Data). ‣Общая бирка Data Science переживет еще как минимум один цикл смены вывесок.
  30. Грядет новая “бирочка”:
 ‣Следующая бирка - точно не Cognitive. ‣Machine

    Intelligence тоже не прижилась. ‣Бирка придет с хайпом оттуда, где будет прорыв: -60% что это будет слабо предсказуемо -30% что будет еще один бум “коммодитизации” -10% что прорыв “привяжут” назад к AI
  31. Рабочая лошадка 
 AI, ML, DS, DM, KDD, Big Data,

    Cognitive и статистики с 1795 года
  32. datafest.ru завтра

  33. Спасибо! @natekin natekin@ods.ai