Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Как взбодрить грустную панду? Используем Pandas в Production

Как взбодрить грустную панду? Используем Pandas в Production

Александр Швец (CTO @ Marilyn) @ Moscow Python Conf 2017
"Последние 7 лет я активно занимаюсь разработкой в области AdTech, а это всегда работа с данными, порой очень и очень большими. Также я читаю курс в Нетологии, посвященный исследованию данных на Python. На Moscow Python Conf я хочу поделиться с вами практикой промышленного использования Pandas и чем она отличается от теории. Ведь существует мнение, что Pandas предназначен только для исследовательских задач или для того, чтобы что-нибудь быстро прикинуть на коленке, так как он медленный и неповоротливый. Однако мы на своем опыте убедились, что Pandas можно и нужно использовать в бою, если вы работаете с большим количеством данных. В докладе я расскажу про оптимизацию Pandas для быстрой обработки больших массивов данных".
Видео: https://conf.python.ru/kak-vzbodrit-grustnuyu-pandu-ispolzuem-pandas-v-production/

Moscow Python Meetup

October 20, 2017
Tweet

More Decks by Moscow Python Meetup

Other Decks in Programming

Transcript

  1. PANDAS • Библиотека для анализа данных • Позволяет Python порвать

    R и любые другие специализированные инструменты • От простых Excel-style задач до машинного обучения
  2. MARILYN НАШ ОПЫТ • 25 октября 2017 системе исполняется 5

    лет • Pandas с 2013 года • Огромное количество внешних источников • “Терабайт слева, терабайт – справа!”
  3. PANDAS – БЫСТРАЯ?! • Построена на основе NumPy и Cython

    • Правильное и неправильное использование может давать разницу в разы
  4. ВЫВОДЫ • Pandas действительно производителен даже в Production • Но

    надо знать нюансы • Для некоторых задач есть все же более подходящие инструменты