Upgrade to Pro — share decks privately, control downloads, hide ads and more …

生成AIと物体検知 (YOLO)の活用例について

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for Ikumi Ono Ikumi Ono
September 13, 2025
470

生成AIと物体検知 (YOLO)の活用例について

Avatar for Ikumi Ono

Ikumi Ono

September 13, 2025
Tweet

Transcript

  1. そもそも⽣成AIとは? 3 • ⽣成AI(Generative AI)は、学習したデータをもとに⽂章や画像、⾳声、 コードなど「新しいコンテンツを⽣み出すAI」のこと • OpenAI の ChatGPT

    は ⾃然⾔語処理に特化した⼤規模⾔語モデル(LLM: Large Language Model) の代表例で、⼊⼒プロンプトに応じて⼈間のように ⾃然な⽂章を⽣成できる
  2. 物体検知とは?YOLOとは? 4 • 物体検知(object detection)とは、画像や動画の中から「どの場所に何が あるか」を⾒つける技術のこと • YOLO (You Only

    Look Once)は物体検知を⾼速かつ⾼精度に⾏うための ディープラーニング(深層学習)モデルの⼀つ • 例)⽝、猫、⼈、⾃動⾞、信号機 などを囲んで「これは⽝、これは⼈」と認 識できる • YOLO は「ディープラーニングを使った画像認識AI」 • したがって AIの⼀種(機械学習モデルの⼀種)に分類される • ただし YOLO ⾃体は「⽣成するAI」ではなく「認識するAI」
  3. 両者の違いまとめ 5 観点 物体検知( YOLOなど) 生成AI(ChatGPTなど) 主な役割 画像の中の物体を検出・分類 入力から新しい文章や画像な どを生成

    AIの種類 認識系AI 生成系AI 技術要素 画像認識用のCNNベースのモデ ル 大規模言語モデル(LLM)や拡 散モデル 出力 バウンディングボックス+ラベル テキスト・画像・音声などのコン テンツ
  4. 使⽤技術の概要 8 名称 概要 目的 備考 YOLO11(yolo11n.pt) 物体検出 インプット画像から鳥を検 出

    OpenCV 画像処理 鳥の部分のみ切り出し Gemini 2.5 Pro 回答生成 鳥の名前などのテキスト を生成 Google AI StudioのFree プラン React + Electron フロントエンド デスクトップアプリの UIを 作成 SQLite データベース 鳥のデータを保持
  5. 組み合わせの利点 9 単体使⽤の限界 【YOLO単体の場合‧‧‧】 • 「⿃がいる」ことはわかるが、種類は不明 • 検出精度:95% → でも「何の⿃?」は答えられない

    【Gemini単体の場合‧‧‧】 • 背景、枝、葉っぱなど不要情報が多すぎる • ノイズ情報に惑わされて判定ミス
  6. Geminiの回答⽐較 15 ⽐較まとめ Geminiへの入力方法 回答の正確さ トークン消費量 元画像のまま 低い: • 東京に生息しない鳥を回答とし

    て生成 • ハルシネーション発生 高い: • トークン消費量:359 • 回答の正確性の低さ(不確実な推論)に より出力テキストが長くなり、トークン量 が多くなった 鳥部分だけ切り抜き 高い: • 正確に鳥の名前を同定 低い: • トークン消費量:338 • 結論+短い説明だけのため出力テキスト が簡潔で、トークン量が少ない
  7. 今後の展望 21 • ⽣成AIでYOLOモデルを強化 • ⽣成させた画像でYOLOの学習を実施する • 学習データの調達が容易 • YOLOの検出精度向上

    + 独⾃ラベルの設定 • ⽣成AIへのプロンプト簡易化=トークン節約 :「ラベル名の⿃について解説お願い」 • オフライン環境で使⽤可能 「YOLO → ⽣成AI」を「⽣成AI → YOLO」へ
  8. おわりに 22 • 物体検出はオワコンではない(⾃戒) • 実際に多くの分野で活躍: ◦ CCTV映像の要約システム ▪ YOLOにより映像内の物体(⼈‧⾞など)を検出し、⽣成AIにて検出

    結果から⽂脈付きのテキスト要約を⽣成する研究が報告されている 参考:https://arxiv.org/html/2501.04764v1?utm_source=chatgpt.com ◦ 洪⽔災害対応システムの構築 ▪ マレーシアの洪⽔災害対応研究では、⽣成AIで合成した洪⽔画像を YOLOモデルの学習に使⽤。実際のドローン撮影映像でも⾼い検出性 能を⽰している。 参考:https://x.gd/1SFTC