Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Red Data Tools で切り開く Ruby の未来
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Kenta Murata
February 25, 2023
Technology
1.3k
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Red Data Tools で切り開く Ruby の未来
Ruby 30周年記念イベント LT
Kenta Murata
February 25, 2023
More Decks by Kenta Murata
See All by Kenta Murata
waitany と waitall を作った話
mrkn
0
320
HolidayJp.jl を作りました
mrkn
0
370
Calling Julia functions from Streamlit applications
mrkn
1
610
Method-based JIT compilation by transpiling to Julia
mrkn
0
9.1k
Apache Arrow C++ Datasets
mrkn
4
1.9k
Reducing ActiveRecord memory consumption using Apache Arrow
mrkn
0
1.9k
RubyData and Rails
mrkn
0
3.4k
Tensor and Arrow
mrkn
0
1.1k
RubyData Current and Future
mrkn
1
3.8k
Other Decks in Technology
See All in Technology
[AWS Summit Japan 2026]迷っているあなたへ_小さな一歩が、やがて自分を助けてくれる
sh_fk2
1
200
Flow 不死:AI 時代 DevOps 的不變本質
cheng_wei_chen
2
360
2026 TECHFRESH 畢業分享會 - 開發日常大解密!從領域驅動到企業級上線
line_developers_tw
PRO
0
1.3k
2026TECHFRESH畢業分享會 - 葬送的通靈師:化系統與用戶雜訊成行動訊號
line_developers_tw
PRO
0
1.3k
Claude Codeをどのように キャッチアップしているか
oikon48
13
8.6k
AIのReact習熟度を測る
uhyo
2
660
Agile and AI Redmine Japan 2026
hiranabe
3
340
現地で盛り上がった WWDC26 Keynote
zozotech
PRO
1
270
小さく始める AI 活用推進 ― 日経電子版 Web チームの事例/nikkei-tech-talk47
nikkei_engineer_recruiting
0
310
Bucharest Tech Week 2026 - Guardians of the Cloud-Native Galaxy
edeandrea
PRO
0
130
「勝手に広まる」人気 AI エージェントを爆速で作ろう!(AWS Summit Japan 2026講演資料)
minorun365
PRO
10
2.1k
エラーバジェットのアラートのタイミングを考える.pdf
kairim0
0
180
Featured
See All Featured
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
66
55k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
200
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
Code Reviewing Like a Champion
maltzj
528
40k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
1
1.7k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
560
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.4k
Building Adaptive Systems
keathley
44
3.1k
Transcript
Red Data Tools で切り開く Ruby の未来 Kenta Murata 2023.02.25 Ruby
30周年記念イベント LT
Ruby 30 周年おめでとうございます
self.introduction Kenta Murata 株式会社サイカ CRO Apache Arrow と CRuby のコミッター
Red Data Tools メンバー
self.introduction Kenta Murata 株式会社サイカ CRO Apache Arrow と CRuby のコミッター
Red Data Tools メンバー ← 今日はこの立場
Contents 1. Red Data Tools 2. Ruby 用データフレームライブラリ 3. まとめ
Red Data Tools https://red-data-tools.github.io/ja/
Red Data Tools とは Ruby用のデータ処理ツールを開発するプロジェクト いま Ruby 界隈で一番ホットな、データ処理ツールの開発者集団 とてもよいポリシーを掲げている
Red Data Tools プロジェクトのポリシー 1. Rubyコミュニティーを超えて協力する 2. 非難することよりも手を動かすことが大事 3. 一回だけの活発な活動よりも小さくてもいいので継続的に活動することが大事
4. 現時点での知識不足は問題ではない 5. 部外者からの非難は気にしない 6. 楽しくやろう!
詳しくは
Red Data Tools の主なプロダクト Red Arrow ファミリー Apache Arrow の
Ruby バインディング (apache/arrow 内にある) Red Datasets オープンデータにアクセスするための統一インターフェイス Charty 複数のバックエンドをサポートする統計的可視化ライブラリ unicode_plot ターミナルでデータ可視化を行うライブラリ YouPlot ターミナルでデータ可視化を行う CLI ツール (unicode_plot を使用)
詳しくは
Ruby 用のデータフレームライブラリについて
データフレーム? データフレームは表の形のデータ構造 トランザクション処理ではなく分析処理を主な用途とする 表を行指向ではなく列指向で管理
行指向?列指向?
行指向?列指向?
データフレーム? データフレームは表の形のデータ構造 トランザクション処理ではなく分析処理を主な用途とする 表を行単位ではなく列単位で管理 選択、結合、集約などの操作、要素単位の演算 複数のデータフレームを扱う操作と演算
Ruby 用データフレームライブラリ Red Amber Polas Ruby pandas Daru
Red Amber https://github.com/heronshoes/red_amber Red Arrow をバックエンドとしてデータフレームを実装 メモリ上のデータ構造は Arrow 形式 Apache
Arrow C++ の機能を利用できる Ruby にとって自然なインターフェイスを目指している heronshoes さんがモリモリと開発している これも Red Data Tools プロダクトのひとつ
Polars Ruby https://github.com/ankane/polars-ruby Polars という Rust 用データフレームライブラリのバインディング Polars は Rust
版 Apache Arrow を使っててめっちゃ速い (blazingly fast)
Polars の速さ 凄く速いので pandas から polars に乗り換える Kaggler が続出している
Polars Ruby https://github.com/ankane/polars-ruby Polars という Rust 用データフレームライブラリのバインディング Polars は Rust
版 Apache Arrow 使っててめっちゃ速い (blazingly fast) Red Amber と同様にメモリ上のデータ構造は Arrow 形式 Polars の Python 版 API に従って実装されている ankane さんがモリモリと開発している
pandas https://github.com/mrkn/pandas.rb Python 用データフレームである pandas を Ruby から使える pycall を用いて
CPython を直接呼び出す形で実装している pycall のおかげで df.applymap(->(x){ x * 5 }) のような事も可能 pandas の全機能について網羅テストをしてないため、未対応の機能があるかも pycall の制限を引き継ぐので、メインスレッド以外では使えないなどの制限がある
daru https://github.com/SciRuby/daru おそらく最古の Ruby 用データフレームライブラリ Pure Ruby で実装されている!! 遅いけど、Ruby さえあれば動く利点もある
残念ながら最近はまったくメンテされていない
25周年のとき (5年前) にあったもの pandas Daru 30周年目で増えたもの Red Amber Polars Ruby
5年で2つも増えた!! Red Amber は Rubyist が使いやすいデータフレームのインターフェイスを目指している Polars Ruby は最速データフレームの Ruby
バインディング どちらも Apache Arrow という共通基盤の上に乗っている どちらも活発に開発が進んでいる
この波に乗るしかない!! Rubyist にとって使いやすいデータフレームを作れるのは Red Amber の良いところ Red Data Tools に参加して一緒に
Red Amber を盛り上げませんか? 最速を求めて Polars Ruby を弄るのも良いと思う (Charty 対応とか!) Daru をメンテする人も増えてほしい
まとめ: Red Data Tools に参加しよう