Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20260415_生成AIを専属DSに_自動レポート作成_ハンズオン_交通事故データ

 20260415_生成AIを専属DSに_自動レポート作成_ハンズオン_交通事故データ

Avatar for NobuakiOshiro

NobuakiOshiro PRO

April 15, 2026

More Decks by NobuakiOshiro

Other Decks in Technology

Transcript

  1. Copyright © 2026 NOB DATA All Rights Reserved. 本⽇の流れ 0.

    オープニング ( 10min ) ・⾃⼰紹介 ・簡単なアンケート ・DS協会と本⽇のイベント趣旨 ・⽣成AIはデータ分析もできる ・AIデータ分析の落とし⽳ 1. 講義+ワーク ( 45min ) ・本⽇使⽤するデータとツール群 ・⽣成AI(LLM)活⽤上の注意点 ・データとツール準備 ・ワーク① Geminiを使って壁打ち & 少量分析 ・ワーク② Google Colabを使って全量分析 ・ワーク③ NotebookLMで資料化 & ラジオ化 ・ワーク④ スプレッドシートで簡易検算 ・ワーク⑤ Google AI Studio Buildで 簡易分析ツール構築( 余⼒あれば ) 2. 休憩 ( 10min ) 3. 成果共有 & 質疑応答(数名発表) ( 20min ) ・どういう観点で⽣成AIに分析を依頼したか、 ハルシネーションは⾒つけられたか、など 4. クロージング ( 5min ) ・第2回⽬の予告
  2. Copyright © 2026 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(twitter

    @doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会九州⽀部 ⽀部⻑ / ASI未来社会研究所 所⻑代理 ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、 意思決定のためのデータ分析勉強会、 オモシロAIごった煮勉強会、ChatGPT部、 AGI福岡、GenAIアナリティクス東京、他 最近は⽣成AIを「企業の意思決定」に 組み込めないか研究中
  3. Copyright © 2026 NOB DATA All Rights Reserved. 簡単なアンケート 質問

    : ⽣成AIの使い⽅について( 複数回答OK ) ① チャットや検索に使ってる ② プログラミングに使ってる ③ データ分析に使ってる ④ 未来予測のシナリオ出しに使ってる
  4. Copyright © 2026 NOB DATA All Rights Reserved. 主催のDS協会と今回のイベント趣旨 •

    主催:⼀般社団法⼈データサイエンティスト協会 九州⽀部 ( 協会本体は2013年に設⽴。九州⽀部は2019年から活動開始 ) https://www.atpress.ne.jp/news/185882 今回は「⽣成AI」でデータ分析を⾝近なものにしていただくための会
  5. Copyright © 2026 NOB DATA All Rights Reserved. 実は、⽣成AIはデータ分析もできる •

    厳密には「⽣成AIがプログラミングをして」データ分析 • ⽇本語で「地図に可視化して」と⾔えば済むので⾮常にお⼿軽 プログラミング プロンプト: 地図に可視化して ⽣成AI (LLM)
  6. Copyright © 2026 NOB DATA All Rights Reserved. ただし、AIデータ分析の落とし⽳が1つ •

    2026年現在の⽣成AIは「ハルシネーション」と呼ばれる嘘を、結構つきます • 「⽣成AIの出してきた結果の検証」をどうするか、が⼤事 Q:このNotebookLMの outputのおかしい部分、 わかります?
  7. Copyright © 2026 NOB DATA All Rights Reserved. ただし、AIデータ分析の落とし⽳が1つ •

    2026年現在の⽣成AIは「ハルシネーション」と呼ばれる嘘を、結構つきます • 「⽣成AIの出してきた結果の検証」をどうするか、が⼤事 間違い Q:このNotebookLMの outputのおかしい部分、 わかります? A:正解は「曇」 15%が間違い ( 晴れまたは曇りで80% ) ( 右上のテキストが正解 )
  8. Copyright © 2026 NOB DATA All Rights Reserved. 全3回の⽬的 •

    第1回:⽣成AIを使ったデータ分析で「便利だな!」と思っていただく & ハルシネーションをどう⾒抜くか、の⼊り⼝ • 第2回:⼀番粒度の細かい n=1のデータから、徐々に予測モデルに変化する 過程を⾒ることで、AIのデータ分析の妥当性を担保 • 第3回:応⽤として、⾃分が使いやすい便利ツールをAIで作れるようになる 九州ではまだまだプロのデータサイエンティストは少ないですが、代わりに ⽣成AIを「専属のデータサイエンティスト」として雇い扱うための講座です
  9. Copyright © 2026 NOB DATA All Rights Reserved. 今回使⽤するデータとツール群 •

    データは福岡県のオープンデータとして公開されている交通事故データを利⽤します • ツールは今回Googleアカウントがあれば誰でも無料で使えるように、ということでGoogleアカ ウントで使える以下を⽤意しています。 • Googleスプレッドシート .. データ確認⽤ • Gemini .. チャット形式の相談役として。あと、画像認識・画像⽣成 • Google Colab .. 全量データの分析⽤のノートブック。課⾦Geminiが今回は使えないので代替策 • NotebookLM .. スライド化やラジオ化に利⽤ • Google AI Studio Build .. Webアプリ開発の際に利⽤。詳しくは第3回で。 • 無料ツールと有料ツールの違い • 利⽤回数制限や、1度に扱えるデータの量が異なります(特にGeminiとNotebookLM) • 今回は無料版でハンズオンをしますが、物⾜りなくなったら課⾦してみるのも1⼿です。
  10. Copyright © 2026 NOB DATA All Rights Reserved. ⽣成AI(LLM)活⽤上の注意点 情報漏洩に気をつける

    • 無料の⽣成AIツールは⼤抵、デフォルトではそのデータがAIの「学習」に活⽤されるため、⼊れた内容が将来 全世界に公開されるリスクがあります。個⼈情報や秘密の情報などは投稿しないように気を付けてください( 特 にGeminiの個⼈版は、ここの解除が難しい ) ⽣成AI(LLM)のウソに騙されない • ⾔語系⽣成AI(LLM)は確率的に⽂章を作成しているため、たまに間違った回答もします(not 検索エンジン) • 結果を鵜呑みにするのではなく、批判的思考、またエビデンスを⾃分で探すなどの検証能⼒が重要になります 情報が古い事に留意する • ⽣成AI(LLM)は学習に時間がかかるので、学習済みの情報は半年〜2年くらい遅れています • いつまでの情報を持っているかは「あなたの学習データのカットオフ⽇はいつ?」と⽣成AIに聞くと教えてく れます
  11. Copyright © 2026 NOB DATA All Rights Reserved. 本⽇使⽤するデータのダウンロード •

    今回は福岡県の「交通事故 オープンデータ」を題材に します • 「令和6年 福岡県 オープ ンデータ 交通事故」で検索 • https://data.bodik.jp/d ataset/400009_2024 • 今回は令和6年1⽉のデー タセットを使います • ダウンロードボタンをク リックすると「r6.1.xlsx」 というエクセルファイルが ⼿に⼊ります コレ
  12. Copyright © 2026 NOB DATA All Rights Reserved. Googleスプレッドシートで中⾝確認 •

    「Google スプレッドシー ト」で検索 • https://docs.google.com/s preadsheets • 「新しいスプレッドシートを 作成」をクリック • ファイル -> インポート、で 先ほどのファイルをアップ ロード & インポートします • 「スプレッドシートを置換す る」にすると、今開いている スプレッドシートにデータが 反映されます ( 上書きされるので注意 ) • ローデータが⾒れるようにな りました。
  13. Copyright © 2026 NOB DATA All Rights Reserved. 確認例:データの件数や項⽬ •

    ざっくりデータの件数や、 どういう項⽬があるかは 最初に眺めることをお勧 めします ( 1⾏⽬はヘッダー、 データ件数は1782⾏ ) • 今回は無料版なので、 Geminiには10件程度、 NotebookLMには100件 程度、Google Colabには 全件の2000件程度のデー タ処理が可能です。 ( 課⾦すると、Geminiも NotebookLMも扱える データ量が増えます )
  14. Copyright © 2026 NOB DATA All Rights Reserved. Google Geminiのログイン⽅法

    • 「Gemini」で検索 • https://gemini.google.com /app?hl=ja • 1回⽬は右上からGoogleアカ ウントでのログインをお願い します • 2回⽬以降はログインのまま で利⽤可能 コレ
  15. Copyright © 2026 NOB DATA All Rights Reserved. 1-1. Geminiに少量データを渡してみましょう

    • 取り急ぎ、10件くらいのデー タをコピーして「これなんで しょう」とGeminiに聞いてみ ましょう • データの量が多すぎると読め なかったりするので、注意
  16. Copyright © 2026 NOB DATA All Rights Reserved. 1-1. Geminiに少量データを渡してみましょう

    • データだけで福岡県のオープン データと⾒抜いてますね ( 私が過去に散々実験したせい かもしれませんが・・ ) • 各項⽬の解説とかも依頼できま す( ⼀般論ベースで回答してく れます。必要に応じて検索 も。 )
  17. Copyright © 2026 NOB DATA All Rights Reserved. 1-2. Geminiで壁打ちをしてみましょう

    • どういうことをやりたいか、 と相談してみると良いです • または、このデータでどうい うことができそうか、を聞い てみるのも良いでしょう。 • 壁打ちでやりたいことの解像 度を上げる、⽣成AI活⽤にお いては必須の⼯程です ( 分析然り、プログラミング 然り。 )
  18. Copyright © 2026 NOB DATA All Rights Reserved. 1-2. Geminiで壁打ちをしてみましょう

    • たくさん壁打ちした後は、 「サマリ」してもらったり 「表形式にまとめて」もらう と情報把握がしやすくなりま す • 有料版のGeminiなどであれば ある程度⼤量のデータを扱え るので、「xxの分析をして」 と伝えてそのまま振興が可能 です ( 今回はおそらく無料版なの で厳しいはず。ということで 次のGoogle Colabの出番で す )
  19. Copyright © 2026 NOB DATA All Rights Reserved. 1-3. Geminiにプロンプトを書いてもらう

    • ツールが変わるので、「ここ までの議論の背景」や「次の AIに依頼するためのプロンプ ト」をGeminiに書いてもらい ます • ここでは「Google Colabに地 図にマッピングするプロンプ ト」を書いてもらいましょう。 ( もちろん、特に前置きなし で⾃分で書いても良いです )
  20. Copyright © 2026 NOB DATA All Rights Reserved. 応⽤:画像解析もGeminiで可能 •

    例えば、事故多発地点の Google Map画像などを Geminiに渡して、「この画像 の危険だと思うポイントを丸 で囲って、その理由も画⾯に 記載した画像を⽣成してくだ さい」という形で、注意喚起 することも可能です。 • この場合はGeminiの画像⽣成 モードを使います。 • また、「画像解析」だけして、 その様⼦をテキストに変換す ることも可能です。
  21. Copyright © 2026 NOB DATA All Rights Reserved. 応⽤:画像解析もGeminiで可能 •

    例えば、事故多発地点の Google Map画像などを Geminiに渡して、「この画像 の危険だと思うポイントを丸 で囲って、その理由も画⾯に 記載した画像を⽣成してくだ さい」という形で、注意喚起 することも可能です。 • この場合はGeminiの画像⽣成 モードを使います。 • また、「画像解析」だけして、 その様⼦をテキストに変換す ることも可能です。
  22. Copyright © 2026 NOB DATA All Rights Reserved. Google Colab(ratory)

    にログインする • 「google colab」で検索 • https://colab.research.goo gle.com/?hl=ja • 正式名称はGoogle Colabratory。略してGoogle Colab。 • ノートブック形式でデータ分 析ができるのですが、ここに も実はGeminiが⼊っているの で「ノーコードで」分析が可 能です ( Google系のサービスは今は ⼤体どこにでもGeminiが⼊り 始めました ) • ログイン後、「ノートブック を新規作成」を押します。
  23. Copyright © 2026 NOB DATA All Rights Reserved. Google Colabを使って分析する

    • 最初は⾊々ごちゃごちゃして ますが、不要なウインドウは 閉じて構いません • 右のような状態にできると、 作業しやすいです
  24. Copyright © 2026 NOB DATA All Rights Reserved. Google Colabを使って分析する

    • データのアップロードをします。 左側のメニューのアップロードア イコンをクリックして、冒頭にダ ウンロードした「r6.1.xlsx」を選 択し、アップロードします • アップロード後に左側のファイル ⼀覧にr6.1.xlxが表⽰されればOK です コレ
  25. Copyright © 2026 NOB DATA All Rights Reserved. Google ColabのGeminiにプロンプトを打つ

    • 前のワークで作ったプロンプトを Google ColabのGeminiに依頼します。 • 特に何もない場合は「r6.1.xlsxのファ イルを解析して、地図上にプロットし、 html形式で出⼒してください」とか指 ⽰すると良いです • 個⼈的には簡単なものからスタートし、 上記に追加で「クラスター表⽰にして、 クリックすると詳細と、Google map のリンクが表⽰されるようにしてくだ さい」のように、段々と要求をアップ していくことが多いです • コードの案が出ますので、OKであれば 「承認して実⾏」をクリックします( ダ メならキャンセルしてリテイク )
  26. Copyright © 2026 NOB DATA All Rights Reserved. Google ColabのGeminiにプロンプトを打つ

    • こんな感じで全量の地 図へのマッピングが ノーコードで簡単に実 現します • 他にも⾊々分析や基礎 集計を試して、最後は htmlレポートか何かに まとめて⼿元に保存す る、とかも便利です。 • ちなみに、Google Colab上で「ダウン ロードリンクをくださ い」というと作ってく れます ( 但し、しばらくする と裏側のファイルは消 えるので要注意 ) ダウン ロード
  27. Copyright © 2026 NOB DATA All Rights Reserved. NotebookLMへのログイン •

    「notebooklm」で検索 • https://notebooklm.goo gle.com/?pli=1 • ログイン後、「ノートブッ クを新規作成」を押します。 コレ
  28. Copyright © 2026 NOB DATA All Rights Reserved. 今回はあえて、NotebookLMの「危ない」使い⽅ •

    こちらがNotebookLMの 画⾯ • ちなみに今回はハルシネー ションを起こすために、あ えて「危ない」使い⽅をや ります ( AIに暗算させて間違えや すくする ) • 今回はエクセルファイルの 中⾝の上から100件(101 ⾏)を「ローデータのま ま」NotebookLMに渡し ます ( 普通は、集計結果とかを ⼊れた⽅がハルシネーショ ンが減って良いです ) コレ
  29. Copyright © 2026 NOB DATA All Rights Reserved. 今回はあえて、NotebookLMの「危ない」使い⽅ •

    こちらがNotebookLMの 画⾯ • ちなみに今回はハルシネー ションを起こすために、あ えて「危ない」使い⽅をや ります ( AIに暗算させて間違えや すくする ) • 今回はエクセルファイルの 中⾝の上から100件(101 ⾏)を「ローデータのま ま」NotebookLMに渡し ます ( 普通は、集計結果とかを ⼊れた⽅がハルシネーショ ンが減って良いです ) データ ⼊れて クリック
  30. Copyright © 2026 NOB DATA All Rights Reserved. 今回はあえて、NotebookLMの「危ない」使い⽅ •

    こんな感じの画⾯に なります • 通常は真ん中の チャット欄でデータ に対して問い合わせ をします • 今回は右の⽅にある • インフォグラ フィック • スライド資料 • ⾳声解説 を試したいと思います ( ポチポチクリックし て5-10分程度待てば OK )
  31. Copyright © 2026 NOB DATA All Rights Reserved. 今回はあえて、NotebookLMの「危ない」使い⽅ •

    作成中の画⾯ ( インフォグラフィッ クは完成しましたね ) 完成 作成中
  32. Copyright © 2026 NOB DATA All Rights Reserved. 参考:「危ない」かもしれないインフォグラフィック •

    ざっくりはあってる ケースもありますが、 数字は検証しないと危 ないです ( NotebookLMのAIに 暗算させてるので) • 通常のGeminiや Google Colabと違っ て、NotebookLMに はAIがプログラミング して実⾏する機能がま だついていない模様
  33. Copyright © 2026 NOB DATA All Rights Reserved. 参考:「危ない」かもしれないスライド •

    後で、この数字があってそ うかは「⼿集計」でやって みましょう • ちなみに、今回は無料の⽣ 成AIツールでやっています が、ある程度課⾦した状態 のGeminiやChatGPTであ れば「AIでスライドの内容 のWチェック」もできたり します ( 時間あればデモだけお⾒ せしますね )
  34. Copyright © 2026 NOB DATA All Rights Reserved. 参考:⾳声ラジオ •

    こっちは、個⼈的には結構 好きです ( そこまでハルシネーション も起きていない印象。まぁ、 暗算集計してないので ) • ローデータを⼊れているの でn=1でピックアップして 回答してくれます • これは第2回で深掘りした いなと思ってますが、 「ローデータを眺める」と ⾊々⾒えてきます https://x.com/doradora09/status/2043973939236606113?s=20
  35. Copyright © 2026 NOB DATA All Rights Reserved. ⼈⼒でも⼀応、軽くチェックはしておきましょう •

    ⼀種の「検品」作業 • 全ての分析をチェックする のは⼤変なので、サンプリ ングで調べたり「⼤枠」が ずれていないか、確認しま す ( 多少のズレは許容しても、 結論がひっくり返る、など は分析としては御法度 ) • n=1でチェックしたり、単 純集計、クロス集計するの が基本です ( ピボットテーブルが便利。 MECE、漏れなくダブりな く、が基本 )
  36. Copyright © 2026 NOB DATA All Rights Reserved. ⼈⼒でも⼀応、軽くチェックはしておきましょう •

    NotebookLMと同じ「上 から100件」に限定してピ ボットテーブルを作ります • その後スライドと同じ「道 路形状」で単純集計 • 操作としては「挿⼊」-> 「ピボットテーブル」-> 「新しいシート」->「作 成」
  37. Copyright © 2026 NOB DATA All Rights Reserved. ⼈⼒でも⼀応、軽くチェックはしておきましょう •

    案の定、集計間違えてました ( 交差点付近で事故が多い、と⾔う ざっくりは正解 ) • AIの「暗算」には気をつけましょう • というか、今回の例のNotebookLM の結果は合計しても「75件」なの で、そこでも気がつけるかなと思い ます ( データは100件投⼊済み ) これが 正解
  38. Copyright © 2026 NOB DATA All Rights Reserved. 余談:別のAIでWチェック •

    課⾦済みのGemini、や ChatGPTであれば、「スライ ドを丸投げしてWチェック」が できます。 • 分析をしたAIとは別のAI、また は別スレッドで検証するのがお すすめです ( 基本的に、⾃分は正しいと思 い込む癖があるのでAIのセルフ チェックは⽢めになる ) • 本格的に使うならAIへの課⾦、 おすすめです
  39. Copyright © 2026 NOB DATA All Rights Reserved. 余談:別のAIでWチェック •

    課⾦済みのGemini、や ChatGPTであれば、「スライ ドを丸投げしてWチェック」が できます。 • 分析をしたAIとは別のAI、また は別スレッドで検証するのがお すすめです ( 基本的に、⾃分は正しいと思 い込む癖があるのでAIのセルフ チェックは⽢めになる ) • 本格的に使うならAIへの課⾦、 おすすめです
  40. Copyright © 2026 NOB DATA All Rights Reserved. 余談:別のAIでWチェック •

    課⾦済みのGemini、や ChatGPTであれば、「スライ ドを丸投げしてWチェック」が できます。 • 分析をしたAIとは別のAI、また は別スレッドで検証するのがお すすめです ( 基本的に、⾃分は正しいと思 い込む癖があるのでAIのセルフ チェックは⽢めになる ) • 本格的に使うならAIへの課⾦、 おすすめです
  41. Copyright © 2026 NOB DATA All Rights Reserved. 余談:別のAIでWチェック •

    1ページずつAIにレビューさせて10点満点でhtmlレポートを書かせる、とかは結構便利です ( PDFでエクスポートすれば、レポートの後ろにレビュー資料としてくっつけたりもできますね )
  42. Copyright © 2026 NOB DATA All Rights Reserved. ワーク⑤ Google

    AI Studio Buildで 簡易分析ツール構築( 余⼒あれば )
  43. Copyright © 2026 NOB DATA All Rights Reserved. Google AI

    StudioのBuild ( ご紹介まで ) • 本格的には第3回で扱いますが、 軽くご紹介まで • Google AI StudioのBuildと⾔ う機能を使うと、「簡単なWeb アプリ」がサクッと作れます • 先ほどのエクセルのファイルを アップロードして基礎集計、く らいは10分もあれば完成します • 出来上がったプログラムは⼿元 に落として使うこともできます ので、ちょっとしたツールを作 りたい場合はおすすめです ( 結構、無邪気にリクエストす ると⾊々作ってくれます )
  44. Copyright © 2026 NOB DATA All Rights Reserved. Google AI

    StudioのBuild ( ご紹介まで ) • 例えば、「以下のデータを多⾓ 的に集計・可視化する分析ダッ シュボード作成を。エクセル ファイルのアップロードにも対 応してください」のような依頼 をすると、こんな感じで作って くれます。 • Buildボタンを押すとGeminiが 頑張って考えてプログラミング してWebアプリを作ります • プログラミング⾔語のデフォル トはTypeScript(JavaScriptの 型付き版)ですが、Pythonに切 り替えも可能です クリック
  45. Copyright © 2026 NOB DATA All Rights Reserved. Google AI

    StudioのBuild ( ご紹介まで ) • 制作過程。5-10分 くらい、頑張って 考えてくれます。 • あと完了すると 「ピコン」と⾳が 鳴るので、わかり やすい
  46. Copyright © 2026 NOB DATA All Rights Reserved. Google AI

    StudioのBuild ( ご紹介まで ) • こんな感じのツー ルがものの10分で できました • 細かな要望などは また後追いでプロ ンプトを打ち込め ば対応してくれま す ( エラーが出た時 は、バグ修正を、 と⾔えばOK )
  47. Copyright © 2026 NOB DATA All Rights Reserved. Google AI

    StudioのBuild ( ご紹介まで ) • 基本的にプログラミングで集計しているので、これは間違いが無いです(バグを除く)
  48. Copyright © 2026 NOB DATA All Rights Reserved. 休憩に⼊る前に:今⽇説明してない⽅法の1つ •

    ちなみに、今回は「あえてNotebookLMに暗算させる」⽅法を取りました • (⽐較的)「安全に」NotebookLMにレポートを書かせる⽅法があるのですが、 後でどなたか成功した⽅はぜひ教えてください
  49. Copyright © 2026 NOB DATA All Rights Reserved. 次回予告:第2回は2026/5/13(⽔) 15:30-17:00(予定)

    • 第1回:⽣成AIを使ったデータ分析で「便利だな!」と思っていただく & ハルシネーションをどう⾒抜くか、の⼊り⼝ • 第2回:⼀番粒度の細かい n=1のデータから、徐々に予測モデルに変化する 過程を⾒ることで、AIのデータ分析の妥当性を担保 • 第3回:応⽤として、⾃分が使いやすい便利ツールをAIで作れるようになる 次回はさらに「AIの出⼒が間違えていないかチェックする」⽅法を 学びます。サイトOPENはこれからですが、ぜひまたお越しください。