Slide 1

Slide 1 text

GPT4でAutoML作ってみたかった

Slide 2

Slide 2 text

自己紹介 yuki ● 趣味 ○ Kaggle ○ バイク ○ ステッカー配り @yuki93753711

Slide 3

Slide 3 text

GPT4すごいですよね GPT4がリリースされすぐに、GPT4と一緒に簡単なWebアプリ作ってみました 簡単なWebアプリですが、企画、設計、実装、デプロイまでGPT4と一緒に作成し、コード に関しては1行も書かずに作成できました

Slide 4

Slide 4 text

GPT4とアプリを作る過程はこんな感じ コードは書いてくれるけど一度ではうまくいかないことが多いので、エラーを伝えて直してもらう のを繰り返す作業がほとんど エラー出てるよ! (コピペ) エラー直したよ コードコピペ エラー出力 ちゃんと動くコード 書いてくれや

Slide 5

Slide 5 text

これって人いらなくね? 人はChatGPTと実行環境それぞれの出力をコピペでつないでいるだけ。コードが期待する 動作をするようになるまでひたすらにコピペする作業。ChatGPTよりも単純労働 期待する動作さえ定義できれば人は必要ない! テストコードを事前に書いておいてテスト通るまで改善を繰り返させればいい コピペ コピペ

Slide 6

Slide 6 text

機械学習にも応用できない? アプリケーションの場合は期待する動作をするまで改善し続けたけど、評価関数がよくなる ように改善させつづけるということをやれば、人がやっている改善のサイクルをGPT4に任せら れないか? この実験やって 実験結果フィードバック モデルの評価方法を人が定義すれば GPT-4がモデルの精度改善を続けてくれるのでは?

Slide 7

Slide 7 text

ってことはkaggleにも応用できない? GPT4をディスカッションや公開notebook、類似コンペのディスカッションにアクセスさせれば 最強モデル作れないか? この実験やって 実験結果フィードバック ディスカッション 公開notebook これで、ゴールドメダル荒稼ぎできますわ!ガハハハ 参照

Slide 8

Slide 8 text

ためしにChatGPT使ってコンペやってみる いきなりGPT4のAPI使って実装するのも大変なので、ChatGPT(Web UI)でうまくい くかやってみる Playgroundコンペで試してみる

Slide 9

Slide 9 text

まずはsub作ってもらう コンペの概要、データセットの説明、データの先頭5行を与えてモデルを作るようにおねがい してみたところ、ちゃんとコード書いてくれた 一発でsub通るコード書いてきた GPT4 ちょろw

Slide 10

Slide 10 text

改善のサイクルまわさせてみる 予測モデルを改善してと繰り返し伝える。予測モデルを作る以外にも、データを確認するコ ードを書くこともできると伝える まかせとけや GPT4 実験結果を踏まえてより精度の良い モデルを作って! Submitファイル作るだけじゃなくて、 データ見ることもできるよ!

Slide 11

Slide 11 text

結果はイマイチ、、 以下の3パターンをひたすら繰り返すのみ。データの中身を見ることなく、同じことを何度も 繰り返す。実験結果を次の改善につなげているというより、少ない引き出しを全部ためして いる感じ アルゴリズム変えてみよう • LightGBM • XGBoost • RandomForest • LogisticRegression 特徴量エンジニアリングしよう ハイパラ探索しよう! とにかくハイパラ探索や!! GPT4

Slide 12

Slide 12 text

少し工夫してみる 少しプロンプトを工夫してみたが結果はいつも同じ • 自らデータを見ようとしないので、最初に統計量や相関行列など、データが把握で きる情報をこちらから見せる データを見せる • 少ないパターンを永遠に繰り返すので、どんな手法が有効そうか最初に列挙させ て、それをためさせる 最初にとりえる手段を列挙させてみる • 「あなたはKaggle Competitioin Grandmasterです」と伝えてみる GMであると伝える GPT4

Slide 13

Slide 13 text

GPT4を使ってkaggleをやるなら GPT4は実験結果をフィードバックして改善させるという使い方は厳しそう。kaggleで活用 するなら、過去のコンペのソリューション等を使いやすい形でまとめておいて、それをもとに subを作ってもらう使い方になるかな 過去の ソリューション等 蓄積 sub 本当はディスカッションを直接参照させてsub作 らせたいけど、ソリューションはハイコンテキストで あることが多いので厳しそう GPT4 copilotや、 gpt-3.5-trubo-16k も活用できるかも?

Slide 14

Slide 14 text

作るところはまでたどり着かず、、、 現在動くものはできてません。。めんどくさがり屋なので、自動化できるものは全部自動化さ せたい!GPT4を使ったAutoML作りたい。(でも、似たようなものもうあってもおかしくない よな) だれか作ってこっそり教えて!