OSSのコード生成型AutoMLを使って20件のPlaygroundを全自動で解いてみた2023年9月23日© 2023 Fujitsu Limited
View Slide
自己紹介○名前:近藤康彦 (ya9do)○所属:富士通株式会社 人工知能研究所© 2023 Fujitsu Limitedビットコイン価格予測2コンペの解法紹介「~やってみた」系のLTが好きですhttps://youtu.be/c1WdEpssND8?t=7256s https://youtu.be/8zPjm9xVWzE?t=2751
○良い感じの動くコードが早く欲しいはじめに:ベースライン作成って結構大変3 © 2023 Fujitsu LimitedAutoMLで簡単にベースラインを作れないか、やってみた# Team Score1 team A 0.122 team B 0.23… … …… … …rf_benchmark.csv 0.56Leader BoardRandomForestもあるけれど、○コード生成型AutoML○github.com/sapientml/sapientml
Titanicを例にした、SapientMLの使い方○データセットとタスク設定を与えると、学習と予測を行うコードを生成© 2023 Fujitsu Limited4出力コードデータセットタスク設定SapientMLの呼び出しSapientML出力例)カテゴリ列の前処理
コンペIDの指定だけで予測提出まで全自動化(*1)出力ユーザー入力(*) 前提条件:ChatGPTとKaggle APIの設定、コンペの参加許諾5 © 2023 Fujitsu Limited43.90コード スコア
コンペIDの指定だけで予測提出まで全自動化(*1)出力ユーザー入力(*) 前提条件:ChatGPTとKaggle APIの設定、コンペの参加許諾6予測CSV© 2023 Fujitsu Limited43.90コード スコア:Kaggle API、 :Playwright、 :ChatGPTコンペ情報実行ChatGPTでタスクを抽出SapientMLコードタスク設定データセット Submit❶❷❸
ベースラインとして使えそうか?7 © 2023 Fujitsu Limited評価観点スコア計算時間Public Scoreコード生成時間 +生成されたコードの実行時間比較対象- rf_benchmark.csv- (参考) 他参加者の1st submitコンペティションPlayground Series3のEpisode 1-20例)https://www.kaggle.com/competitions/playground-series-s3e20種類
結果© 2023 Fujitsu Limited8コンペティションSapientMLスコア順位rf_benchmarkスコア順位SapientML計算時間(秒)s3e1 0.607 0.705 33s3e2 0.283 0.284 6s3e3 0.34 0.577 8s3e4 0.624 0.587 103s3e5 0.522 0.582 4s3e6 0.234 0.3 21s3e7 0.332 0.406 9s3e8 0.636 0.681 109s3e9 0.782 0.383 6s3e10 0.509 0.331 103s3e11 0.758 0.636 180s3e12 0.726 0.096 4s3e13 -1 -1 -1s3e14 0.425 0.356 13s3e15 -1 -1 -1s3e16 0.339 0.575 44s3e17 0.49 0.32 24s3e18 -1 0.197 -1s3e19 -1 0.399 -1s3e20 0.425 0.672 32○20件中16件の自動化に成功○スコアはrf_benchmark.csvと同程度○最大3分でコード生成・スコア順位は参加者数で除算し正規化・自動化失敗時は-1と記載
スコア比較(1/2)9スコア順位参加者数で順位を除算し0-1に変換凡例●:SapientML■:rf_benchmark.csv×:参加者の1st submission© 2023 Fujitsu Limited○順位とスコアの可視化○横軸:左に行くほど優秀○縦軸:コンペ指標によって優劣の方向は異なるスコア
10 © 2023 Fujitsu Limitedスコア比較(2/2)全自動化失敗全自動化失敗全自動化失敗全自動化失敗凡例●:SapientML■:rf_benchmark.csv×:参加者の1st submission
まとめ○コード生成型AutoML “SapientML”を使ってPlaygroundを解いてみた○3分でrf_benchmark.csvと同程度のスコアを出すコードを生成⇒ ベースライン作成に役立つのではないか○公開しています○GitHub :github.com/sapientml/sapientml○お試し環境 :automl.jp.fujitsu.com/ja/page/howtouse11 © 2023 Fujitsu Limited# Team Score1 team A 0.12… … …rf_benchmark.csv 0.56良い感じのベースラインにしたい!… SapientML 0.54Leader Board… … …
Thank you© 2023 Fujitsu Limited
© 2023 Fujitsu Limited13
14 © 2023 Fujitsu Limitedスコア比較 w/ 1st sub, w/ AutoGluon全自動化失敗全自動化失敗全自動化失敗全自動化失敗凡例●:SapientML■:rf_benchmark.csv●:AutoGluon×:参加者の1st submission
15 © 2023 Fujitsu Limitedスコア比較 w/ LeaderBoard, w/ AutoGluon全自動化失敗全自動化失敗全自動化失敗全自動化失敗凡例●:SapientML■:rf_benchmark.csv●:AutoGluon×:LeaderBoard