Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
NobuakiOshiro
PRO
July 10, 2025
Technology
1
54
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250726_DeepResearchで何かしらの情報を調べた後のTips
doradora09
PRO
1
46
20250718_分析業務への生成AI活用(テキストマイニングを例題に)
doradora09
PRO
1
80
20250715_AI時代到来・企業リスクへの生成AI活用術
doradora09
PRO
0
67
20250709_第3回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
78
20250625_生成 AI 活用2年目の壁を突破せよ_(60min版)
doradora09
PRO
0
54
20250628_生成AIおすすめyoutube共有会_ChatGPT部第69回
doradora09
PRO
0
67
20250614_LT_走れメロスの個人情報マスク処理をMacStudio 512GBメモリマシンで試してみた
doradora09
PRO
1
12
20250607_AIから始めるロボット勉強会_HuggingFaceについて
doradora09
PRO
0
27
20250604_ビール片手に生成AIデモ
doradora09
PRO
0
26
Other Decks in Technology
See All in Technology
Findy Freelance 利用シーン別AI活用例
ness
0
670
Cloud WANの基礎から応用~少しだけDeep Dive~
masakiokuda
3
110
Backlog AI アシスタントが切り開く未来
vvatanabe
1
160
UDDのススメ - 拡張版 -
maguroalternative
1
600
AWS DDoS攻撃防御の最前線
ryutakondo
1
170
薬屋のひとりごとにみるトラブルシューティング
tomokusaba
0
380
Lambda management with ecspresso and Terraform
ijin
2
170
いかにして命令の入れ替わりについて心配するのをやめ、メモリモデルを愛するようになったか(改)
nullpo_head
7
2.7k
LLMで構造化出力の成功率をグンと上げる方法
keisuketakiguchi
0
980
Amazon Qで2Dゲームを作成してみた
siromi
0
160
工業高校で学習したとあるエンジニアのキャリアの話
shirayanagiryuji
0
110
LTに影響を受けてテンプレリポジトリを作った話
hol1kgmg
0
380
Featured
See All Featured
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
4 Signs Your Business is Dying
shpigford
184
22k
Embracing the Ebb and Flow
colly
86
4.8k
Become a Pro
speakerdeck
PRO
29
5.5k
Docker and Python
trallard
45
3.5k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
810
Making Projects Easy
brettharned
117
6.3k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Agile that works and the tools we love
rasmusluckow
329
21k
Into the Great Unknown - MozCon
thekraken
40
2k
Unsuck your backbone
ammeep
671
58k
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.4k
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!