Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
NobuakiOshiro
PRO
July 10, 2025
Technology
1
110
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250110_ChatGPT部2026年の抱負
doradora09
PRO
0
86
[NotebookLM製]20251210_AIによる前処理について
doradora09
PRO
0
12
20251122_第1回ローカルLLMなんでも勉強会_オープニングトーク
doradora09
PRO
0
130
20251122_LT_スマホ版軽量ローカルLLMで人物名マスク
doradora09
PRO
0
120
20251120_LT_AIで今年の漢字を予想する
doradora09
PRO
0
60
20251120_生成AI(LLM)で自習する方法とバイブコーディング入門
doradora09
PRO
0
24
20251025_LT_catgpt_atlasでわかるOpenAI歴
doradora09
PRO
0
49
20251015_LT_BIのAIがAGI過渡期は流行るのではと思った話
doradora09
PRO
0
27
20251015_第4回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
12
Other Decks in Technology
See All in Technology
2026/01/16_実体験から学ぶ 2025年の失敗と対策_Progate Bar
teba_eleven
1
220
「AIでできますか?」から「Agentを作ってみました」へ ~「理論上わかる」と「やってみる」の隔たりを埋める方法
applism118
5
4.1k
クラウドセキュリティの進化 — AWSの20年を振り返る
kei4eva4
0
160
AI開発の落とし穴 〜馬には乗ってみよAIには添うてみよ〜
sansantech
PRO
9
3.9k
ドメイン駆動セキュリティへの道しるべ
pandayumi
0
180
BiDiってなんだ?
tomorrowkey
2
490
2026年はチャンキングを極める!
shibuiwilliam
2
350
新規事業における「一部だけどコア」な AI精度改善の優先順位づけ
zerebom
0
250
【Oracle Cloud ウェビナー】ランサムウェアが突く「侵入の隙」とバックアップの「死角」 ~ 過去の教訓に学ぶ — 侵入前提の防御とデータ保護 ~
oracle4engineer
PRO
2
220
Git Training GitHub
yuhattor
1
270
プロダクトエンジニアこそ必要なPMスキル 〜デリバリー力を最大化し、価値を届け続けるために〜
layerx
PRO
0
130
さくらのクラウドでのシークレット管理を考える/tamachi.sre#2
fujiwara3
1
220
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
190
Color Theory Basics | Prateek | Gurzu
gurzu
0
190
Code Reviewing Like a Champion
maltzj
527
40k
Between Models and Reality
mayunak
1
170
Writing Fast Ruby
sferik
630
62k
It's Worth the Effort
3n
188
29k
WCS-LA-2024
lcolladotor
0
430
Code Review Best Practice
trishagee
74
19k
Getting science done with accelerated Python computing platforms
jacobtomlinson
1
100
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
620
[SF Ruby Conf 2025] Rails X
palkan
0
720
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!