Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
NobuakiOshiro
PRO
July 10, 2025
Technology
0
22
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250709_第3回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
42
20250625_生成 AI 活用2年目の壁を突破せよ_(60min版)
doradora09
PRO
0
49
20250628_生成AIおすすめyoutube共有会_ChatGPT部第69回
doradora09
PRO
0
55
20250607_AIから始めるロボット勉強会_HuggingFaceについて
doradora09
PRO
0
22
20250604_ビール片手に生成AIデモ
doradora09
PRO
0
18
20250524_ChatGPT部第67回_オープニングトーク
doradora09
PRO
0
11
20250503_第1回AIロボット勉強会_自動生成サマリ(ファクトチェック前)
doradora09
PRO
0
17
20250503_第1回aiロボット勉強会
doradora09
PRO
0
24
20250503_ロボティクス関連調査_ディープリサーチ調べ(エビデンスチェック前)
doradora09
PRO
0
19
Other Decks in Technology
See All in Technology
AI時代の開発生産性を加速させるアーキテクチャ設計
plaidtech
PRO
3
160
「クラウドコスト絶対削減」を支える技術—FinOpsを超えた徹底的なクラウドコスト削減の実践論
delta_tech
4
170
FOSS4G 2025 KANSAI QGISで点群データをいろいろしてみた
kou_kita
0
400
さくらのIaaS基盤のモニタリングとOpenTelemetry/OSC Hokkaido 2025
fujiwara3
3
440
Sansanのデータプロダクトマネジメントのアプローチ
sansantech
PRO
0
160
SEQUENCE object comparison - db tech showcase 2025 LT2
nori_shinoda
0
140
成長し続けるアプリのためのテストと設計の関係、そして意思決定の記録。
sansantech
PRO
0
120
KubeCon + CloudNativeCon Japan 2025 Recap by CA
ponkio_o
PRO
0
300
Beyond Kaniko: Navigating Unprivileged Container Image Creation
f30
0
130
Flutter向けPDFビューア、pdfrxのpdfium WASM対応について
espresso3389
0
130
OSSのSNSツール「Misskey」をさわってみよう(右下ワイプで私のOSCの20年を振り返ります) / 20250705-osc2025-do
akkiesoft
0
160
freeeのアクセシビリティの現在地 / freee's Current Position on Accessibility
ymrl
2
200
Featured
See All Featured
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
107
19k
Side Projects
sachag
455
42k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
It's Worth the Effort
3n
185
28k
How GitHub (no longer) Works
holman
314
140k
Intergalactic Javascript Robots from Outer Space
tanoku
271
27k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.5k
Thoughts on Productivity
jonyablonski
69
4.7k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Visualization
eitanlees
146
16k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!