Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
you(@youtoy)
PRO
March 16, 2025
Technology
0
86
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
you(@youtoy)
PRO
March 16, 2025
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
M5Stack Chain DualKey を UIFlow 2.0 + USB接続で試す / ビジュアルプログラミングIoTLT vol.22
you
PRO
2
91
ローカルLLMをJavaScriptで(少しAIエージェントSDKなどの話も) / 冬のJavaScript祭り @Pleasanter Lounge
you
PRO
0
930
Webの技術で「特殊なゲーム用コントローラーや他デバイスなど」とブラウザを連携させる / HTML5 11th Anniversary
you
PRO
0
74
ブラウザのAPIで Nintendo Switch用の特殊なゲーム用コントローラーを体験型コンテンツに / IoTLT @ストラタシス・ジャパン
you
PRO
0
190
ローカルLLMとLINE Botの組み合わせ その2(EVO-X2でgpt-oss-120bを利用) / LINE DC Generative AI Meetup #7
you
PRO
1
860
生成AIとM5Stack / M5 Japan Tour 2025 Autumn 東京
you
PRO
0
420
子ども向けの活動や自身のモノづくり活動などでやったこと / micro:bit ファンの集い
you
PRO
0
34
ブラウザのAPIで色々なデバイスをあれこれ扱ってみた話(主にWeb HID API) / IoTLT @JLCPCB オープンハードカンファレンス
you
PRO
0
160
ヒーローズ・リーグの応募作品で使ったデバイス・アイテム・ライブラリなど / #ヒーローズリーグ 2025 開発素材LT
you
PRO
0
63
Other Decks in Technology
See All in Technology
みんなでAI上手ピーポーになろう! / Let’s All Get AI-Savvy!
kaminashi
0
180
エンジニアとして長く走るために気づいた2つのこと_大賀愛一郎
nanaism
0
210
AWSと暗号技術
nrinetcom
PRO
1
100
会社紹介資料 / Sansan Company Profile
sansan33
PRO
13
400k
旬のブリと旬の技術で楽しむ AI エージェント設計開発レシピ
chack411
1
300
漸進的過負荷の原則
sansantech
PRO
3
250
EventBridge API Destination × AgentCore Runtimeで実現するLambdaレスなイベント駆動エージェント
har1101
4
180
困ったCSVファイルの話
mottyzzz
1
350
BPaaSオペレーション・kubell社内 n8n活用による効率化検証事例紹介
kubell_hr
0
160
なぜCREを8年間続けているのか / cre-camp-4-2026-01-21
missasan
0
1k
Eight Engineering Unit 紹介資料
sansan33
PRO
0
6.4k
CodeRabbit CLI + Claude Codeの連携について
oikon48
1
580
Featured
See All Featured
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
0
1.8k
Bash Introduction
62gerente
615
210k
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
0
2.3k
WENDY [Excerpt]
tessaabrams
9
35k
Done Done
chrislema
186
16k
First, design no harm
axbom
PRO
2
1.1k
Deep Space Network (abreviated)
tonyrice
0
35
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.2k
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
190
SEO for Brand Visibility & Recognition
aleyda
0
4.2k
Code Review Best Practice
trishagee
74
19k
GraphQLとの向き合い方2022年版
quramy
50
14k
Transcript
2025年3月16日 (日) @横須賀市産業交流プラザ 豊田陽介( ) @youtoy 横須賀プログラミング“夢”アカデミー 〜デモをまじえつつの生成AIの話題〜
自己紹介 ・ IT系イベント主催、登壇や運営なども ・ 技術書の出版や技術記事執筆も ・ モノづくり活動(作品作り、展示) ・ 子ども向けの活動いろいろ プライベートでの活動
・ ガジェット大好き ・ 学生の時の専門分野は情報科学 その他 豊田陽介( ) @youtoy イトナブ ガジェット エバンジェリスト
ガジェットを使ったモノづくり・展示 ブラウザで動作するアプリ ・描画(シェーダー) ・太鼓の利用(Gamepad API) ・空気ポンプの利用(p5.sound)
生成AI関連のリリースが 多すぎる 笑 (3/10週のごく一部だけを見ても)
3/13: Google 特定機能の全ユーザーへの展 開やその他: ・無料版ユーザーでも Deep Research を利用可能に
3/11: OpenAI 新しいAPI のリリースなど: ・Responses API ・Agents SDK
3/12: Google(その2) 新しいオープンなモデル: ・Gemma 3
3/14: OpenAI(その2) ChatGPT のデータ解析(Advanced Data Analysis)でのモデル追加: ・推論モデル(o1・o3-mini) が 利用可能に
他にも色々な情報が 出ていました
今日はいくつかの 生成AI関連の話をピックアップ (紹介できないものも多数)
デモをまじえつつ 生成AIの話題を紹介 (※ デモは分かりやすそうなものを)
今日デモをする生成AIでできること ・どんどん性能が上がっている 生成AIのモデル ・生成AIと他のものを連携させる仕組み ・情報の調査・まとめ ・Adobeの生成AIの一例
▪ 続々と登場している 生成AIのモデル
▪ 新しめの生成AIのモデル (特定の企業のもののみ抜粋)
OpenAI・Anthropic・Google リスト ・OpenAI: o3-mini、GPT-4.5 ・Anthropic: Claude 3.7 Sonnet ・Google: Gemini
2.0系 (※ 他企業も色々出してるけど省略) 推論モデルや深い思考なしのモデル、拡 張思考モード・標準思考モードが共存す るハイブリッド推論モデルなど
【デモ】 Anthropic: Claude 3.7 Sonnet (Webで話題になってた事例で)
Claude 3.7 Sonnet で ビジュアル表現を工夫した HTML の出力
【デモ】 Google: Gemini 2.0 Flash Experimental (Webで話題になってた事例で)
Gemini 2.0 Flash Experimental によるアニメーション用フレーム の生成・写真の視点変更
▪ 生成AIと別のものを つなぐ仕組み
▪ MCP:LLMに外部連携の 仕組みを足せたりなど
Anthropic:Model Context Protocol(MCP) デスクトップ版Claudeからローカルの ファイルやアプリを扱えたり、外部連携 の処理を色々扱えたりなど 例えばデスクトップ版Claudeなどと 組み合わせて使う形
【MCP関連の動画紹介】 デスクトップ版Claudeで Blenderを利用
BlenderMCP
紹介のみ
▪ ビジュアルプログラミング で LLM を扱う
Dify
デモをまじえつつ
▪ 情報の調査・まとめを推論を しながら進める生成AI
▪ 検索と推論を組み合わせて 詳細な調査を行なう仕組み
OpenAI: ChatGPT の deep research 同じ系統のもの ・Google: Gemini の Deep
Research ・Perplexity の Deep Research ・xAI: Grok の DeepSearch ・。。。(Genspark とか他...) ※ こちらの中には無料枠があるものも 現状は有償のプランでのみ利用可能 (Plusプランや Proプランなど)
【デモ】 OpenAI: ChatGPT の deep research
【デモ】 Google: Gemini の Deep Research
▪ Adobe Firefly
最近も新しい機能が公開されている
【デモ】 Adobe Firefly で シーンから画像生成
Adobe Firefly で シーンから画像生成 (Beta)
▪ 開発用のエディタ上で 直接開発を助けてくれる
【デモ】 VS Code上で GitHub Copilot (チャット、編集)
紹介のみ
▪ ローカルの処理で LLMを利用
モデルは種類が多数(多すぎ...) モデルを扱いやすくしてくれるもの ・Ollama ・LM Studio ・MLX LM、MLX-VLM(Apple Silicon向け) ※ 他もあるけど省略
Hugging Face で公開されているモデル を使うパターンが多い
▪ 自動操作関連
OpenAI: Operator(ブラウザの自動操作) PC自動操作も含む同系統(?)のもの ・Browser Use(OSS) ・Anthropic: Computer use ・OpenAI: Computer
use ※ 他もあるけど省略 現状は一部の有償プランでのみ利用可能 (Proプラン)
【デモ】 OpenAI の Operator
今日は扱わなかった 内容の一部を紹介
1)自律的に開発を進める仕組みのもの 人に確認しつつ進めるものだったり、 ガンガン進めていくものだったり ・Cursor、Windsurf など(IDE提供型) ・Cline、Roo Code など(IDE用拡張機能型) ・Devin ・GitHub
Copilot エージェントモード ・。。。
2)各社のモデル 話題になったものだと 例えば DeepSeek のモデル
3)Web開発関連 有名どころで例えば Vercel の v0、 StackBlitz の Bolt.new
4)大手クラウドの生成AI関連 AWS関連、Azure関連、 Google Cloud関連など
5)生成AI関連のAPI 冒頭で紹介したような 新しいAPI の公開も
6)様々な生成を行うもの 音、動画、3Dモデル、 などを生成するもの
7)自分が用意したデータをもとに回答を得る 自分がアップロードしたデータを もとにした回答をしてもらうもの、 自分が用意したデータを生成AIが 検索できるようにする仕組み
これでも掲載しきれてない ものが大量に
自分がやってみたい分野 での生成AIの活用の話は 見ておくと良いかも