Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CodeFest 2018. Алексей Натёкин (Open Data Science, Arktur, DM Labs) — Откуда вырос и куда растет Data Science?

CodeFest
April 05, 2018

CodeFest 2018. Алексей Натёкин (Open Data Science, Arktur, DM Labs) — Откуда вырос и куда растет Data Science?

Посмотрите выступление Алексея: https://2018.codefest.ru/lecture/1309/

Мы часто слышим про разные успехи не то Data Science с Machine Learning, не то AI или вообще Big Data. Но что это вообще такое? Эти вещи как-то связаны? Что вообще происходит? Попробуем разобраться.

Уровень
Общий, формул не ожидается, развлекательные вещи присутствуют

CodeFest

April 05, 2018
Tweet

More Decks by CodeFest

Other Decks in Programming

Transcript

  1. 7

  2. ИНФОРМАЦИЯ 2011 2012 2013 2014 2015 2016 2017 2010 2009

    2008 DM Labs Алексей Натекин 2018
  3. 2011 2012 2013 2014 2015 2016 2017 2010 2009 2008

    2018 Data Mining Big Data Data Science AI + cognitive хз что + machine intelligence + any other stuff
  4. Заметность 
 Время 1. запуск технологии 2. пик завышенных ожиданий

    3. пропасть разочарований 4. плато продуктивности 2014 2015 2013
  5. Data [driven] Science:
 ‣“The art of turning data into actions”

    ‣“Interdisciplinary field about scientific methods, processes and systems to extract knowledge or insights from data in various forms” ‣“A newly emerging field dedicated to analyzing and manipulating data to derive insights and build data products”
  6. + KDD: Knowledge 
 Discovery (in) Databases Развитие Machine Learning

    “Отстаньте от нас, мы не AI, у нас все четко и научно, без философии”
  7. + Data Mining = 
 Датасеты непонятной фигни (привет интернет)

    + 
 Machine Learning • Statistical learning школа • Развитие PGM • SVM vs NN
  8. Сколько Data Science лет?
 ‣Термин придумали в 60-ых. Вспомнили и

    начали форсить с 2008-го, как общую бирочку. Всем зашло. ‣Ранее Data Mining. Ранее KDD. Ранее Статистика.
 Моделирование и Machine Learning — all inclusive. 
 
 
 P.S. Big Data - неудачный “бизнесовый” ребрендинг. 
 P.P.S. AI - очередная попытка такого ребрендинга.
  9. “A data scientist is someone who is better at statistics

    than any software engineer and better at software engineering than any statistician.”
  10. Statistics
 Data Mining Сюда же:,
 этика и безопасность AI, философия

    сильного ИИ и сверх-сильного ИИ, аватары, … Сюда же: визуализация,
 теория принятия решений, специфичные подобласти (эконометрика++), оптимизация, … Data Science AI Machine
 Learning Big Data
 HPC
  11. Applications Computation Mathematics Domain & business expertise Programming & data

    engineering Statistics and machine learning (ML) research scientists Data 
 scientist
  12. Applications Computation Mathematics Domain & business expertise Programming & data

    engineering Statistics and machine learning Business & data analysts (Big) Data engineers (ML) research scientists Data 
 scientist
  13. Что ждет Data Science?
 ‣То же самое, что и с

    Computer Science в 90-ых. ‣Взросление. Процессы, инструменты, best practices. Сейчас у нас колхоз. ‣Область идет в массы. Компьютерная грамотность 2.0. Мы уже пошли по школам РФ. ‣Спрос на специалистов и их работу будет расти.
  14. Грядет новая “бирочка”:
 ‣Точно появится в ближайшие 2-3 года, к

    2020-му. ‣Бирку AI уберут в шкаф еще лет на 10. Хайпанули и можно честь знать (см. Big Data). ‣Общая бирка Data Science переживет еще как минимум один цикл смены вывесок.
  15. Грядет новая “бирочка”:
 ‣Следующая бирка - точно не Cognitive. ‣Machine

    Intelligence тоже не прижилась. ‣Бирка придет с хайпом оттуда, где будет прорыв: -60% что это будет слабо предсказуемо -30% что будет еще один бум “коммодитизации” -10% что прорыв “привяжут” назад к AI
  16. Рабочая лошадка 
 AI, ML, DS, DM, KDD, Big Data,

    Cognitive и статистики с 1795 года