Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
qeMLパッケージの紹介
Search
bob3bob3
December 15, 2023
Science
0
1.2k
qeMLパッケージの紹介
caretやtidymodelsと同じような機械学習のラッパーqeMLパッケージの紹介
bob3bob3
December 15, 2023
Tweet
Share
More Decks by bob3bob3
See All by bob3bob3
Rでコンジョイント分析 2024年版
bob3bob3
0
300
『改訂新版前処理大全』の話と Apache Parquet の話 #TokyoR
bob3bob3
0
210
R言語の環境構築と基礎 Tokyo.R 112
bob3bob3
0
380
『データ可視化学入門』をPythonからRに翻訳した話(増強版)
bob3bob3
0
360
『データ可視化学入門』を PythonからRに翻訳した話
bob3bob3
1
430
「国と音楽」 ~spotifyrを用いて~ #muana
bob3bob3
2
390
パーマーステーションのペンギンたち#3 探索的データ分析(EDA)編
bob3bob3
1
520
Redditで遊ぼう #TokyoR 106
bob3bob3
0
580
シン・初心者のためのR-Tips
bob3bob3
0
400
Other Decks in Science
See All in Science
PRML Chapter 1 (1.3-1.6)
snkmr
1
170
A Theory of Scrum Team Effectiveness 〜『ゾンビスクラムサバイバルガイド』の裏側にある科学〜
bonotake
15
6.2k
Pokemon Roughs
shoryuuken
0
490
統計的因果探索の方法
sshimizu2006
1
990
ABEMAの効果検証事例〜効果の異質性を考える〜
s1ok69oo
4
1.8k
Machine Learning for Materials (Lecture 3)
aronwalsh
0
900
第4回ナレッジグラフ勉強会 Knowledge Graph Embedding
maruru0090
0
160
構造設計のための3D生成AI-最新の取り組みと今後の展開-
kojinishiguchi
0
280
Celebrate UTIG: Staff and Student Awards 2024
utig
0
200
Leveraging conformal prediction for calibrated probabilistic time series forecasts to accelerate the renewable energy transition
ingevandenende
2
310
プロダクト開発を通して学んだナレッジマネジメントの哲学
sonod
0
110
いまAI組織が求める企画開発エンジニアとは?
roadroller
2
1.1k
Featured
See All Featured
YesSQL, Process and Tooling at Scale
rocio
166
14k
How to Think Like a Performance Engineer
csswizardry
4
590
Building Better People: How to give real-time feedback that sticks.
wjessup
357
18k
Designing with Data
zakiwarfel
96
5k
The Pragmatic Product Professional
lauravandoore
29
6.1k
Building an army of robots
kneath
301
42k
Building Effective Engineering Teams - LeadDev
addyosmani
47
2.2k
Why You Should Never Use an ORM
jnunemaker
PRO
51
8.9k
Making the Leap to Tech Lead
cromwellryan
127
8.7k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
149
45k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
189
16k
Become a Pro
speakerdeck
PRO
15
4.8k
Transcript
qeMLパッケージの紹介 R研究集会2023 (2023/12/16) @bob3bob3
qeMLパッケージとは? • caret、mlr3、tidymodelsと同じような、機械 学習に統一的なインターフェイスを提供する ラッパー。 • 「qe」は「quick and easy」。 •
とにかくシンプルで「 one liner」で機械学習を 事項できるのが売り。
作者 Norman Matloff The Art of R Programming (2011) の著者。
実行例 library(qeML) # メジャーリーガーのデータセット。ポジション、身長、体重、年齢 data(mlb1) # 体重を推定するモデル # 決定木、ランダムフォレスト、勾配ブースティング mlb1_rpart
<- mlb1 |> qeRpart("Weight") mlb1_rf <- mlb1 |> qeRFranger("Weight") mlb1_gb <- mlb1 |> qeGBoost("Weight")
実行例 # 推定 new_data <- data.frame(Position='Catcher', Height=73, Age=28) mlb1_rpart |>
predict(new_data) mlb1_rf |> predict(new_data) mlb1_gb |> predict(new_data) # これだけ! # 簡単だね!
Enjoy?
いやいや、まてまて • バリデーションは? • ハイパーパラメーターのチューニングは?
バリデーションは勝手にやってくれる # testデータでのMAE mlb1_rpart$testAcc mlb1_rf$testAcc mlb1_gb$testAcc data.frame( name = c("rpart",
"rf", "gb"), MAE = list(mlb1_rpart, mlb1_rf, mlb1_gb) |> map_dbl(\(x) pluck(x, "testAcc")) ) |> arrange(MAE) # name MAE # 1 rf 13.23741 # 2 gb 13.74169 # 3 rpart 14.24358
チューニングもできる # ランダムフォレストのグリッドサーチ例 qs_ft_rf <- mlb1 |> qeFT( "Weight", "qeRFranger",
pars = list(nTree= seq(100, 1000, 250), minNodeSize= seq(10, 30, 10)), nTst = 100, nXval = 10, showProgress=TRUE ) qs_ft_rf$outdf |> slice_min(meanAcc) # nTree minNodeSize meanAcc CI bonfCI # 1 350 10 8.326976 8.531146 8.653432
その他の機能 • 次元縮約、次元削減 • 並列化 • 欠損補完 • モデルの比較 •
Quick Start, ML Overviewなど親切なビネットがたくさん! • データセットも山盛り
……ただし • まだまだ開発中で発展途上。 • ドキュメントも書きかけという感じ。 • 実装されている手法がcaret、tidymodelsと比べるとまだ少ない。 • 実装が不完全な手法もある(xgboost, lightgbmなど)
• バリデーションの評価指標を変更ができない • Macだとインストールできないらしい(誰か検証して!)
Enjoy!