Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Analysis with Ruby using PyCall

Data Analysis with Ruby using PyCall

The slide used in DataScience.rb 2017.05.19

7cca11c5257fda526eeb4b1ada28f904?s=128

Kenta Murata

May 19, 2017
Tweet

Transcript

  1. Data Analysis with Ruby using PyCall Kenta Murata Speee Inc.

    DataScience.rb 2017.05.19
  2. DataScience.rb 2017.05.19 self.introduction • Kenta Murata • Speee Inc. •

    CRuby committer
  3. DataScience.rb 2017.05.19 self.gems • bigdecimal • enumerable-statistics • pycall •

    matplotlib ← ← today’s topic
  4. Data Analysis with Ruby using PyCall

  5. PyCall

  6. DataScience.rb 2017.05.19 For docker-ready people $ git clone git@github.com:mrkn/ pycall.git

    $ cd pycall $ rake docker:run
  7. DataScience.rb 2017.05.19 For docker-unready people • Access to
 https://github.com/mrkn/pycall

  8. DataScience.rb 2017.05.19 • https://github.com/mrkn/pycall

  9. DataScience.rb 2017.05.19 • https://github.com/mrkn/pycall

  10. DataScience.rb 2017.05.19 Demo

  11. DataScience.rb 2017.05.19 実際に使ってみた感想 • pandas, scikit-learn, seaborn などが 使えるのはデータ分析をする上で非常 に便利である

    • 現状の制限である不自然な記法は、 PyCall 開発者の私でも煩わしい • 現時点では、PyCall を使って Ruby で やる意義を見出せない場合が多い
  12. DataScience.rb 2017.05.19 現時点で便利に使えそうなシーン • Ruby スクリプトで生成したデータを pandas で加工して matplotlib や

    seaborn で可視化する • 以上
  13. DataScience.rb 2017.05.19 今後の予定 by RubyKaigi • オブジェクトをちゃんと free する •

    不自然な記法をできるだけ廃止 • numpy, pandas, scikit-learn など主 要なライブラリは特別なラッパーを 作ってより Ruby らしい使い方を実現 • バージョン 1.0 のリリース
  14. DataScience.rb 2017.05.19 今後の予定 after RubyKaigi • Keras, Chainer などをちゃんと使える ようにする

    • R と Julia のブリッジ • Spark と Stan をなんとかしたい