Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20240302_ChatGPTで交通事故分析_ハンズオン_公開用

 20240302_ChatGPTで交通事故分析_ハンズオン_公開用

NobuakiOshiro

March 02, 2024
Tweet

More Decks by NobuakiOshiro

Other Decks in Technology

Transcript

  1. Copyright © 2024 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(twitter

    @doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会九州⽀部 ⽀部⻑ / iU 情報経営イノベーション専⾨職⼤学 客員教員 ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、 オモシロAIごった煮勉強会、ChatGPT部、 他2つ 毎⽉第2・第4⼟曜⽇の10:00-11:00 はChatGPT部を実施中(⼀般参加歓迎)
  2. Copyright © 2024 NOB DATA All Rights Reserved. 本⽇のハンズオンの狙い •

    福岡県の交通事故のオープンデータを、ChatGPTを⽤いて可視化・分析・考察 し交通事故減少に向けたアイディアを検討します • ChatGPTを使えば簡単なデータ分析は、ほぼノンプログラミングでできるの で、ぜひ使い⽅のコツを習得されてください https://note.com/chatgpt_nobdata/n/n2c0f526bd252
  3. Copyright © 2024 NOB DATA All Rights Reserved. 本⽇の流れ •

    ハンズオンパート (30min) • 導⼊ • チーム分けなどの説明 • 福岡県の交通事故のオープンデータの概要 • データ分析の⼀連の流れを体験 • 仮説を⽴てる • さまざまな軸でデータを集計・可視化する • データを地図にプロットする • 考察する・対策を検討する • グループワーク (40min) • 各チーム、発表 & 質疑応答・感想など (40min)
  4. Copyright © 2024 NOB DATA All Rights Reserved. チーム分けについてはよしなに決定するとして、 •

    ChatGPT活⽤の注意事項 • 機密情報は⼊れないこと。また、2割くらいは嘘の回答が出る前提で使 うこと。 • ハンズオンの注意事項 • 今回利⽤するChatGPT-4は1ライセンスにつき40回/3時間、の制限が あります • 準備しているアカウントの数にも限りがあるので、GPT-4を利⽤すると きはある程度無駄打ちは避けていただくと助かります • なお、GPT-3.5のモードなら利⽤回数制限なしなので、ちょっとした実 験はこちらでも可能です。 (ただ、3.5はあまり賢くない&プログラムの実⾏機能は使えませんので ご注意ください)
  5. Copyright © 2024 NOB DATA All Rights Reserved. データの説明&ダウンロード先 •

    「福岡県 オープンデータ 交通事故 令和3年 ⽉別」で検索 https://data.bodik.jp/dataset/401000 _2021koutauujiko_tsukibetsu
  6. Copyright © 2024 NOB DATA All Rights Reserved. データの説明&ダウンロード先 •

    今回は例として、1⽉のデータをダウンロードしてください (r3.1.xlsxファイル) • 中⾝はこんな感じです。ちょっと眺めてみましょう(1分くらい)
  7. Copyright © 2024 NOB DATA All Rights Reserved. お題と初期仮説構築 •

    本⽇のお題は 「交通事故を減らすには?オープンデータから⾒る傾向と対策案」 ということでいきたいと思います • まず、データを⾒る前に、「こういうケースで事故が多そう」とい うものをざっくり考えてみてください(2-3分) (データ⾒る前の仮説レベルなので、全然間違えててもOKです) (グループで協議してもOK) • 後で分析する際の切り⼝や、⽐較の材料にします。 (想定通りなのか、意外な結果が得られたのか、など)
  8. Copyright © 2024 NOB DATA All Rights Reserved. 参考:仮説の例(ざっくりでOK) •

    免許取り⽴ての若者や、⾼齢者の事故が多いのでは? • ⾬や雪の⽇の事故が多いのでは? • 特定の⾒通しの悪い交差点で事故が多いのでは? などなど。
  9. Copyright © 2024 NOB DATA All Rights Reserved. データをChatGPTで眺める •

    ChatGPT-4はファイルのアッ プロードが可能です。 • 先ほどダウンロードしたエク セルファイルをアップロード し、 「これはなんでしょうか?」 と聞いてみてください(2-3 分) • また裏ではPythonのプログ ラムも実⾏可能です(よしな にやってくれると思います)
  10. Copyright © 2024 NOB DATA All Rights Reserved. データをChatGPTに基礎集計&可視化してもらう 1.

    「よしなにいくつかの軸で集計してもらえますか?」と ChatGPTに指⽰してみてください(2-3分) ・任意の軸を指定してもOKです(性別、年代など) 2. 続いて、「先ほどの集計結果を可視化してください。 ただし、⽇本語は⽂字化けするので英語表記に変換すること」 と指⽰してみてください。(2-3分) ・なお、図が出ない場合は「このUI上に図が表⽰されないようです」や 「HTMLファイルとして出⼒してください」などの指⽰すると良いです
  11. Copyright © 2024 NOB DATA All Rights Reserved. 参考:実⾏例 補⾜:ChatGPTがプログラムを使わない場合

    は集計が間違うケースもあるので、検証は必要 補⾜:UIで図が出ない場合はダウンロード (この例ではpng画像)
  12. Copyright © 2024 NOB DATA All Rights Reserved. データを地図上にプロットしてもらう •

    「Pythonとfoliumを⽤いて、先ほどのデータを地図上にプロットし てください。またクラスター表⽰を⾏い、クリックすると事故の概 要が表⽰されるように」と指⽰してください(5分) • ファイルがダウンロードできない場合は「リンクにアクセスできない ようです。HTMLファイルとしてダウンロードできるようにしてもら えますか?」などの追加依頼 • データ量が多いと失敗するケースがあるので、その場合は「先頭の 100件を処理してください」「ランダムに100件抽出して可視化してく ださい」などデータの縮⼩をトライしてみてください
  13. Copyright © 2024 NOB DATA All Rights Reserved. 考察・対策の検討 •

    「ここまでの結果を元に考察と、事故防⽌のための対策案を表形式でいくつか 考えてください」と指⽰をだしてみてください(5分) • またご⾃⾝が気になる観点の切り⼝で質問してもOKです • なお、ここから先は相互に切り⼝や視点を変えつつChatGPTと対話しつつ、 考察を深めて対策を考えることになります (各⾃チームのワークパート。最後に結果を3-5分くらいで発表) • ご⾃⾝の初期仮説と⽐較しつつ、違和感がないかなども検証してみてください (ChatGPTの結果が必ずしも正しいわけではないので、⾃分の感覚も⼤切) • 確らしさを確認するために、エビデンスとなる数値を併せて出してもらう、 なども有効です
  14. Copyright © 2024 NOB DATA All Rights Reserved. グループワークお題2つ 1.

    交通事故データの深掘りをお願いします 2. 北九州のオープンデータを探して遊んでみてください https://www.open-governmentdata.org/kitakyushu-city/ 16:10に各チーム発表
  15. Copyright © 2024 NOB DATA All Rights Reserved. グループワークセッション •

    チームに分かれて、さらに考察を深めてください • そのあと、5-10分程度で各チーム発表 • 特定のエリアに絞ってみたり、性別年代に注⽬してみたり、などと ⾊々アイディアをいれていただければと。 (ただし、1アカウントあたり 40回/3時間、の制限には注意) • チューターの皆さんも巡回しますので、何かありましたら適宜質問をお願いし ます