Slide 1

Slide 1 text

Data Analysis with Ruby using PyCall Kenta Murata Speee Inc. DataScience.rb 2017.05.19

Slide 2

Slide 2 text

DataScience.rb 2017.05.19 self.introduction • Kenta Murata • Speee Inc. • CRuby committer

Slide 3

Slide 3 text

DataScience.rb 2017.05.19 self.gems • bigdecimal • enumerable-statistics • pycall • matplotlib ← ← today’s topic

Slide 4

Slide 4 text

Data Analysis with Ruby using PyCall

Slide 5

Slide 5 text

PyCall

Slide 6

Slide 6 text

DataScience.rb 2017.05.19 For docker-ready people $ git clone git@github.com:mrkn/ pycall.git $ cd pycall $ rake docker:run

Slide 7

Slide 7 text

DataScience.rb 2017.05.19 For docker-unready people • Access to
 https://github.com/mrkn/pycall

Slide 8

Slide 8 text

DataScience.rb 2017.05.19 • https://github.com/mrkn/pycall

Slide 9

Slide 9 text

DataScience.rb 2017.05.19 • https://github.com/mrkn/pycall

Slide 10

Slide 10 text

DataScience.rb 2017.05.19 Demo

Slide 11

Slide 11 text

DataScience.rb 2017.05.19 実際に使ってみた感想 • pandas, scikit-learn, seaborn などが 使えるのはデータ分析をする上で非常 に便利である • 現状の制限である不自然な記法は、 PyCall 開発者の私でも煩わしい • 現時点では、PyCall を使って Ruby で やる意義を見出せない場合が多い

Slide 12

Slide 12 text

DataScience.rb 2017.05.19 現時点で便利に使えそうなシーン • Ruby スクリプトで生成したデータを pandas で加工して matplotlib や seaborn で可視化する • 以上

Slide 13

Slide 13 text

DataScience.rb 2017.05.19 今後の予定 by RubyKaigi • オブジェクトをちゃんと free する • 不自然な記法をできるだけ廃止 • numpy, pandas, scikit-learn など主 要なライブラリは特別なラッパーを 作ってより Ruby らしい使い方を実現 • バージョン 1.0 のリリース

Slide 14

Slide 14 text

DataScience.rb 2017.05.19 今後の予定 after RubyKaigi • Keras, Chainer などをちゃんと使える ようにする • R と Julia のブリッジ • Spark と Stan をなんとかしたい