Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Введение в ML и BigData разработку

Введение в ML и BigData разработку

More Decks by Технострим Mail.ru Group

Other Decks in Education

Transcript

  1. Сколько данных? 1) Несколько сотен записей или терабайты 2) Сколько

    полезной информации в данных? 3) Достаточно ли ноута или нужен кластер
  2. Где будем хранить? 1) Реляционная база данных (MySQL, SQLite, PostgreSQL,

    … ) 2) Нереляционная база данных aka NoSQL (Cassandra, HBase) 3) Может будет достаточно Pandas DataFrame? 4) Как их мы будем анализировать? Нужен ли online?
  3. Примеры задач 1) Нам нужно по фотографии определить марку машины

    2) Мы должны предсказать рыночную цену квартиры по адресу, числу комнат, общей площади, этажу 3) Нужно подобрать рекламу пользователю, чтобы оптимизировать вероятность клика