Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
Search
you(@youtoy)
PRO
March 16, 2025
Technology
0
68
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
you(@youtoy)
PRO
March 16, 2025
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
ブラウザのAPIで Nintendo Switch用の特殊なゲーム用コントローラーを体験型コンテンツに / IoTLT @ストラタシス・ジャパン
you
PRO
0
63
ローカルLLMとLINE Botの組み合わせ その2(EVO-X2でgpt-oss-120bを利用) / LINE DC Generative AI Meetup #7
you
PRO
0
100
生成AIとM5Stack / M5 Japan Tour 2025 Autumn 東京
you
PRO
0
260
子ども向けの活動や自身のモノづくり活動などでやったこと / micro:bit ファンの集い
you
PRO
0
13
ブラウザのAPIで色々なデバイスをあれこれ扱ってみた話(主にWeb HID API) / IoTLT @JLCPCB オープンハードカンファレンス
you
PRO
0
130
ヒーローズ・リーグの応募作品で使ったデバイス・アイテム・ライブラリなど / #ヒーローズリーグ 2025 開発素材LT
you
PRO
0
40
最近発売された端末+UIFlow 2.0の組み合わせ(+1.0の話)をUSB接続で / ビジュアルプログラミングIoTLT vol.21
you
PRO
0
100
AIエージェント開発用SDKとローカルLLMをLINE Botと組み合わせてみた / LINEを使ったLT大会 #14
you
PRO
0
210
ブラウザで CircuitPython の開発:公式の「CircuitPython Code Editor」を試した / 【屋形船開催】IoT縛りの勉強会! IoTLT vol.126 @東京湾
you
PRO
0
140
Other Decks in Technology
See All in Technology
Zephyr(RTOS)にEdge AIを組み込んでみた話
iotengineer22
0
200
ソースを読むプロセスの例
sat
PRO
15
9.4k
OSSで50の競合と戦うためにやったこと
yamadashy
1
140
やる気のない自分との向き合い方/How to Deal with Your Unmotivated Self
sanogemaru
1
530
Node.js 2025: What's new and what's next
ruyadorno
0
640
難しいセキュリティ用語をわかりやすくしてみた
yuta3110
0
330
衛星画像超解像化によって実現する2D, 3D空間情報の即時生成と“AI as a Service”/ Real-time generation spatial data enabled_by satellite image super-resolution
lehupa
0
190
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
3
20k
「改善」ってこれでいいんだっけ?
ukigmo_hiro
0
370
HR Force における DWH の併用事例 ~ サービス基盤としての BigQuery / 分析基盤としての Snowflake ~@Cross Data Platforms Meetup #2「BigQueryと愉快な仲間たち」
ryo_suzuki
0
240
RDS の負荷が高い場合に AWS で取りうる具体策 N 連発/a-series-of-specific-countermeasures-available-on-aws-when-rds-is-under-high-load
emiki
7
4.3k
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
14k
Featured
See All Featured
Automating Front-end Workflow
addyosmani
1371
200k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
How to Think Like a Performance Engineer
csswizardry
27
2.1k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Done Done
chrislema
185
16k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
190
55k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.7k
A Modern Web Designer's Workflow
chriscoyier
697
190k
A designer walks into a library…
pauljervisheath
209
24k
Site-Speed That Sticks
csswizardry
13
910
Transcript
2025年3月16日 (日) @横須賀市産業交流プラザ 豊田陽介( ) @youtoy 横須賀プログラミング“夢”アカデミー 〜デモをまじえつつの生成AIの話題〜
自己紹介 ・ IT系イベント主催、登壇や運営なども ・ 技術書の出版や技術記事執筆も ・ モノづくり活動(作品作り、展示) ・ 子ども向けの活動いろいろ プライベートでの活動
・ ガジェット大好き ・ 学生の時の専門分野は情報科学 その他 豊田陽介( ) @youtoy イトナブ ガジェット エバンジェリスト
ガジェットを使ったモノづくり・展示 ブラウザで動作するアプリ ・描画(シェーダー) ・太鼓の利用(Gamepad API) ・空気ポンプの利用(p5.sound)
生成AI関連のリリースが 多すぎる 笑 (3/10週のごく一部だけを見ても)
3/13: Google 特定機能の全ユーザーへの展 開やその他: ・無料版ユーザーでも Deep Research を利用可能に
3/11: OpenAI 新しいAPI のリリースなど: ・Responses API ・Agents SDK
3/12: Google(その2) 新しいオープンなモデル: ・Gemma 3
3/14: OpenAI(その2) ChatGPT のデータ解析(Advanced Data Analysis)でのモデル追加: ・推論モデル(o1・o3-mini) が 利用可能に
他にも色々な情報が 出ていました
今日はいくつかの 生成AI関連の話をピックアップ (紹介できないものも多数)
デモをまじえつつ 生成AIの話題を紹介 (※ デモは分かりやすそうなものを)
今日デモをする生成AIでできること ・どんどん性能が上がっている 生成AIのモデル ・生成AIと他のものを連携させる仕組み ・情報の調査・まとめ ・Adobeの生成AIの一例
▪ 続々と登場している 生成AIのモデル
▪ 新しめの生成AIのモデル (特定の企業のもののみ抜粋)
OpenAI・Anthropic・Google リスト ・OpenAI: o3-mini、GPT-4.5 ・Anthropic: Claude 3.7 Sonnet ・Google: Gemini
2.0系 (※ 他企業も色々出してるけど省略) 推論モデルや深い思考なしのモデル、拡 張思考モード・標準思考モードが共存す るハイブリッド推論モデルなど
【デモ】 Anthropic: Claude 3.7 Sonnet (Webで話題になってた事例で)
Claude 3.7 Sonnet で ビジュアル表現を工夫した HTML の出力
【デモ】 Google: Gemini 2.0 Flash Experimental (Webで話題になってた事例で)
Gemini 2.0 Flash Experimental によるアニメーション用フレーム の生成・写真の視点変更
▪ 生成AIと別のものを つなぐ仕組み
▪ MCP:LLMに外部連携の 仕組みを足せたりなど
Anthropic:Model Context Protocol(MCP) デスクトップ版Claudeからローカルの ファイルやアプリを扱えたり、外部連携 の処理を色々扱えたりなど 例えばデスクトップ版Claudeなどと 組み合わせて使う形
【MCP関連の動画紹介】 デスクトップ版Claudeで Blenderを利用
BlenderMCP
紹介のみ
▪ ビジュアルプログラミング で LLM を扱う
Dify
デモをまじえつつ
▪ 情報の調査・まとめを推論を しながら進める生成AI
▪ 検索と推論を組み合わせて 詳細な調査を行なう仕組み
OpenAI: ChatGPT の deep research 同じ系統のもの ・Google: Gemini の Deep
Research ・Perplexity の Deep Research ・xAI: Grok の DeepSearch ・。。。(Genspark とか他...) ※ こちらの中には無料枠があるものも 現状は有償のプランでのみ利用可能 (Plusプランや Proプランなど)
【デモ】 OpenAI: ChatGPT の deep research
【デモ】 Google: Gemini の Deep Research
▪ Adobe Firefly
最近も新しい機能が公開されている
【デモ】 Adobe Firefly で シーンから画像生成
Adobe Firefly で シーンから画像生成 (Beta)
▪ 開発用のエディタ上で 直接開発を助けてくれる
【デモ】 VS Code上で GitHub Copilot (チャット、編集)
紹介のみ
▪ ローカルの処理で LLMを利用
モデルは種類が多数(多すぎ...) モデルを扱いやすくしてくれるもの ・Ollama ・LM Studio ・MLX LM、MLX-VLM(Apple Silicon向け) ※ 他もあるけど省略
Hugging Face で公開されているモデル を使うパターンが多い
▪ 自動操作関連
OpenAI: Operator(ブラウザの自動操作) PC自動操作も含む同系統(?)のもの ・Browser Use(OSS) ・Anthropic: Computer use ・OpenAI: Computer
use ※ 他もあるけど省略 現状は一部の有償プランでのみ利用可能 (Proプラン)
【デモ】 OpenAI の Operator
今日は扱わなかった 内容の一部を紹介
1)自律的に開発を進める仕組みのもの 人に確認しつつ進めるものだったり、 ガンガン進めていくものだったり ・Cursor、Windsurf など(IDE提供型) ・Cline、Roo Code など(IDE用拡張機能型) ・Devin ・GitHub
Copilot エージェントモード ・。。。
2)各社のモデル 話題になったものだと 例えば DeepSeek のモデル
3)Web開発関連 有名どころで例えば Vercel の v0、 StackBlitz の Bolt.new
4)大手クラウドの生成AI関連 AWS関連、Azure関連、 Google Cloud関連など
5)生成AI関連のAPI 冒頭で紹介したような 新しいAPI の公開も
6)様々な生成を行うもの 音、動画、3Dモデル、 などを生成するもの
7)自分が用意したデータをもとに回答を得る 自分がアップロードしたデータを もとにした回答をしてもらうもの、 自分が用意したデータを生成AIが 検索できるようにする仕組み
これでも掲載しきれてない ものが大量に
自分がやってみたい分野 での生成AIの活用の話は 見ておくと良いかも