デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会（2025年3月）

2025年3月16日 (日) @横須賀市産業交流プラザ豊田陽介（） @youtoy 横須賀プログラミング“夢”アカデミー〜デモをまじえつつの生成AIの話題〜

自己紹介・ IT系イベント主催、登壇や運営なども・技術書の出版や技術記事執筆も・モノづくり活動（作品作り、展示）・子ども向けの活動いろいろプライベートでの活動
・ガジェット大好き・学生の時の専門分野は情報科学その他豊田陽介（） @youtoy イトナブガジェットエバンジェリスト

ガジェットを使ったモノづくり・展示ブラウザで動作するアプリ・描画（シェーダー）・太鼓の利用（Gamepad API）・空気ポンプの利用（p5.sound）

生成AI関連のリリースが多すぎる笑（3/10週のごく一部だけを見ても）

3/13： Google 特定機能の全ユーザーへの展開やその他：・無料版ユーザーでも Deep 　Research を利用可能に

3/11： OpenAI 新しいAPI のリリースなど：・Responses API ・Agents SDK

3/12： Google（その2）新しいオープンなモデル：・Gemma 3

3/14： OpenAI（その2） ChatGPT のデータ解析（Advanced Data Analysis）でのモデル追加：・推論モデル（o1・o3-mini）が　利用可能に

他にも色々な情報が出ていました

今日はいくつかの生成AI関連の話をピックアップ（紹介できないものも多数）

デモをまじえつつ生成AIの話題を紹介（※ デモは分かりやすそうなものを）

今日デモをする生成AIでできること・どんどん性能が上がっている　生成AIのモデル・生成AIと他のものを連携させる仕組み・情報の調査・まとめ・Adobeの生成AIの一例

▪ 続々と登場している生成AIのモデル

▪ 新しめの生成AIのモデル（特定の企業のもののみ抜粋）

OpenAI・Anthropic・Google リスト・OpenAI： o3-mini、GPT-4.5 ・Anthropic： Claude 3.7 Sonnet ・Google： Gemini
2.0系（※ 他企業も色々出してるけど省略）推論モデルや深い思考なしのモデル、拡張思考モード・標準思考モードが共存するハイブリッド推論モデルなど

【デモ】 Anthropic： Claude 3.7 Sonnet （Webで話題になってた事例で）

Claude 3.7 Sonnet でビジュアル表現を工夫した HTML の出力

【デモ】 Google： Gemini 2.0 Flash Experimental （Webで話題になってた事例で）

Gemini 2.0 Flash Experimental によるアニメーション用フレームの生成・写真の視点変更

▪ 生成AIと別のものをつなぐ仕組み

▪ MCP：LLMに外部連携の仕組みを足せたりなど

Anthropic：Model Context Protocol（MCP）デスクトップ版Claudeからローカルのファイルやアプリを扱えたり、外部連携の処理を色々扱えたりなど例えばデスクトップ版Claudeなどと組み合わせて使う形

【MCP関連の動画紹介】デスクトップ版Claudeで Blenderを利用

BlenderMCP

紹介のみ

▪ ビジュアルプログラミングで LLM を扱う

デモをまじえつつ

▪ 情報の調査・まとめを推論をしながら進める生成AI

▪ 検索と推論を組み合わせて　詳細な調査を行なう仕組み

OpenAI： ChatGPT の deep research 同じ系統のもの・Google： Gemini の Deep
Research ・Perplexity の Deep Research ・xAI： Grok の DeepSearch ・。。。（Genspark とか他...） ※ こちらの中には無料枠があるものも現状は有償のプランでのみ利用可能（Plusプランや Proプランなど）

【デモ】 OpenAI： ChatGPT の deep research

【デモ】 Google： Gemini の Deep Research

▪ Adobe Fireﬂy

最近も新しい機能が公開されている

【デモ】 Adobe Fireﬂy でシーンから画像生成

Adobe Fireﬂy でシーンから画像生成 (Beta)

▪ 開発用のエディタ上で直接開発を助けてくれる

【デモ】 VS Code上で GitHub Copilot （チャット、編集）

紹介のみ

▪ ローカルの処理で LLMを利用

モデルは種類が多数（多すぎ...）モデルを扱いやすくしてくれるもの・Ollama ・LM Studio ・MLX LM、MLX-VLM（Apple Silicon向け） ※ 他もあるけど省略
Hugging Face で公開されているモデルを使うパターンが多い

▪ 自動操作関連

OpenAI： Operator（ブラウザの自動操作） PC自動操作も含む同系統（？）のもの・Browser Use（OSS）・Anthropic： Computer use ・OpenAI： Computer
use ※ 他もあるけど省略現状は一部の有償プランでのみ利用可能（Proプラン）

【デモ】 OpenAI の Operator

今日は扱わなかった内容の一部を紹介

1）自律的に開発を進める仕組みのもの人に確認しつつ進めるものだったり、ガンガン進めていくものだったり・Cursor、Windsurf など（IDE提供型）・Cline、Roo Code など（IDE用拡張機能型）・Devin ・GitHub
Copilot エージェントモード・。。。

2）各社のモデル話題になったものだと例えば DeepSeek のモデル

3）Web開発関連有名どころで例えば Vercel の v0、 StackBlitz の Bolt.new

4）大手クラウドの生成AI関連 AWS関連、Azure関連、 Google Cloud関連など

5）生成AI関連のAPI 冒頭で紹介したような新しいAPI の公開も

6）様々な生成を行うもの音、動画、3Dモデル、などを生成するもの

7）自分が用意したデータをもとに回答を得る自分がアップロードしたデータをもとにした回答をしてもらうもの、自分が用意したデータを生成AIが検索できるようにする仕組み

これでも掲載しきれてないものが大量に

自分がやってみたい分野での生成AIの活用の話は見ておくと良いかも

デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会（2025年3月）

デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会（2025年3月）

More Decks by you（@youtoy）

Other Decks in Technology

Featured

Transcript