Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリングを学ぶ

 LT_ChatGPTxRxGoogleColab_ペンギンデータを使って分析・モデリングを学ぶ

NobuakiOshiro

May 27, 2023
Tweet

More Decks by NobuakiOshiro

Other Decks in Science

Transcript

  1. LT :
    ChatGPT x R x Google Colab
    ペンギンデータを使って
    分析・モデリングを学ぶ
    2023/05/27
    @doradora09

    View Slide

  2. ⾃⼰紹介
    ⼤城信晃(@doradora09)
    NOB DATA株式会社 代表取締役社⻑ /
    データサイエンティスト協会 九州⽀部 委員⻑
    ・住まい
    沖縄 -> 東京 -> 福岡
    ・職歴
    ヤフー-> DATUM STUDIO ->
    LINE Fukuoka -> NOB DATA(株) 創業
    ・運営コミュニティ
    ・過去
    ・Tokyo.R(2010-2016)
    ・現在
    ・fukuoka.R、PyData.Fukuoka、
    意思決定のためのデータ分析勉強会、
    オモシロAIごった煮勉強会、ChatGPT部 fukuoka.R運営メンバー。
    最近2ヶ⽉はChatGPTばかり触ってます

    View Slide

  3. サテライト観戦での勉強会も企画中 (主に今はTokyo.Rをサテライト観戦)
    https://satellite-study.connpass.com/

    View Slide

  4. ChatGPT & 本⽇のLTについて
    • 世間を騒がしているOpenAI社の⼤規
    模⾔語モデル
    • プログラミングもできるので、今回は
    データ分析初⼼者を想定してChatGPT
    に分析の⽅法を教えてもらって⾃習で
    きるようになるのがゴール
    • 環境も揃えたいので、Google Colabで
    Rを実⾏
    • 今回は有料版のGPT-4で動かしてます
    https://chat.openai.com/?model=gpt-4
    ChatGPT

    View Slide

  5. 本⽇のデータセット
    • Palmerpenguinsパッケージのデータ
    (通称ペンギンデータ)
    • 3種類のペンギンのデータセットです
    (アデリーペンギン、
    ヒゲペンギン、ジェンツーペンギン)
    https://allisonhorst.github.io/palmerpenguins/

    View Slide

  6. Google Colab で Rを実⾏
    • Rの環境構築もばらつきがある
    のでGoogle Colabにて。
    • 気がついたら標準でRに対応し
    ていました。ランタイム->ラ
    ンタイムの変更でR⾔語指定が
    できます。
    (しかしいつの間に・・今まで
    は⼀⼿間かかってた)
    • 分析環境が同じだとセミナー
    とかやりやすくなりますね

    View Slide

  7. 以下、ダイジェストにて

    View Slide

  8. ①ChatGPTにデータセットについて聞く
    Q : あなたはR⾔語の
    palmerpenguinsパッケージとデー
    タセットを知っていますか?

    View Slide

  9. ②ChatGPTに分析⼿順について聞く
    • Q : R⾔語初⼼者向けに、google
    colab上でR⾔語を動かし、
    palmerpenguinsのデモをしたい
    と思います。どのような分析をし
    たら良いか、表形式でアイディア
    をいただけますか?

    View Slide

  10. ②ChatGPTに分析⼿順について聞く
    • Q : R⾔語初⼼者向けに、google
    colab上でR⾔語を動かし、
    palmerpenguinsのデモをしたい
    と思います。どのような分析をし
    たら良いか、表形式でアイディア
    をいただけますか?

    View Slide

  11. ③必要パッケージの導⼊
    • Q : 2-4のコードをお願いします。
    • ChatGPTにコードの例を出⼒
    してもらい、Google Colabで
    実⾏して動作確認
    • 全体のコードは割愛

    View Slide

  12. ③必要パッケージの導⼊ & データ確認
    • Q : 2-4のコードをお願いします。
    • ChatGPTにコードの例を出⼒
    してもらい、Google Colabで
    実⾏して動作確認
    • 全体のコードは割愛
    Google
    Colab

    View Slide

  13. ④可視化サンプル
    • Q :ステップ5のサンプルコード
    をいくつかのパターンでお願いし
    ます。
    • ChatGPTにコードの例を出⼒
    してもらい、Google Colabで
    実⾏して動作確認
    • 全体のコードは割愛

    View Slide

  14. ④可視化サンプル
    • Q :ステップ5のサンプルコード
    をいくつかのパターンでお願いし
    ます。
    • ChatGPTにコードの例を出⼒
    してもらい、Google Colabで
    実⾏して動作確認
    • 全体のコードは割愛

    View Slide

  15. ⑤予測モデルの学習フェーズ
    • Q : 6-9のステップをお願いしま
    す。
    • モデリング以降も実施
    • エラーが出たら修正依頼
    • 全体のコードは割愛

    View Slide

  16. 補⾜:エラーが出た場合は修正依頼
    • Q :
    Error in eval(family$initialize): y
    values must be 0 <= y <= 1
    Traceback:
    • モデリング以降も実施
    • エラーが出たら修正依頼
    (エラー⽂⾔をそのまま投げれば
    GPT-4は結構汲み取ってくれます)
    • 全体のコードは割愛

    View Slide

  17. 補⾜:エラーが出た場合は修正依頼
    • Q :
    こちらの変更を加えた、モデリン
    グパート以降のソースコードを再
    度表⽰してください。
    • モデリング以降も実施
    • エラーが出たら修正依頼
    (エラー⽂⾔をそのまま投げれば
    GPT-4は結構汲み取ってくれます)
    • ここから再開して、という指定も
    可能
    • 全体のコードは割愛

    View Slide

  18. ⑥予測モデルの実⾏と結果の評価
    • Q :今回作成したモデルの性能評
    価を⾏う⼿順を表形式でお願いし
    ます。
    • 性能評価の⽅法確認
    • 混同⾏列やROCカーブ
    • 全体のコードは割愛

    View Slide

  19. ⑥予測モデルの実⾏と結果の評価
    • Q :今回作成したモデルの性能評
    価を⾏う⼿順を表形式でお願いし
    ます。
    • 性能評価の⽅法確認
    • 混同⾏列やROCカーブ
    • でもペンギンデータってこんなに
    予測性能でるんでしたっ
    け・・??
    • 全体のコードは割愛
    怪しい・・

    View Slide

  20. 補⾜2:outputの解説依頼
    • Outputがテキストばっかりでどう解釈したら良いか分からな
    い、というときはそれを聞けば解説してくれます

    View Slide

  21. さいごに
    • ChatGPT x R x Google Colabで楽々データ分析学習
    • これから勉強したい!という⽅はChatGPT先⽣を味⽅にしてぜひデータ
    分析の世界にもチャレンジされてみてはいかがでしょうか

    View Slide

  22. Enjoy .. !!

    View Slide