Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NobuakiOshiro
PRO
July 10, 2025
Technology
1
130
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
【中東情勢関連】2026/3/5現在:チャッピー先生調べ・NotebookLMまとめ ( バイアス多め )
doradora09
PRO
0
18
20250110_ChatGPT部2026年の抱負
doradora09
PRO
0
97
[NotebookLM製]20251210_AIによる前処理について
doradora09
PRO
0
17
20251122_第1回ローカルLLMなんでも勉強会_オープニングトーク
doradora09
PRO
0
150
20251122_LT_スマホ版軽量ローカルLLMで人物名マスク
doradora09
PRO
0
150
20251120_LT_AIで今年の漢字を予想する
doradora09
PRO
0
77
20251120_生成AI(LLM)で自習する方法とバイブコーディング入門
doradora09
PRO
0
31
20251025_LT_catgpt_atlasでわかるOpenAI歴
doradora09
PRO
0
60
20251015_LT_BIのAIがAGI過渡期は流行るのではと思った話
doradora09
PRO
0
36
Other Decks in Technology
See All in Technology
OpenClawで回す組織運営
jacopen
3
640
[AEON TECH HUB #24] お客様の長期的興味の理解に向けて
alpicola
0
120
トップマネジメントとコンピテンシーから考えるエンジニアリングマネジメント
zigorou
4
760
ブラックボックス観測に基づくAI支援のプロトコルのリバースエンジニアリングと再現~AIを用いたリバースエンジニアリング~ @ SECCON 14 電脳会議 / Reverse Engineering and Reproduction of an AI-Assisted Protocol Based on Black-Box Observation @ SECCON 14 DENNO-KAIGI
chibiegg
0
160
「ヒットする」+「近い」を同時にかなえるスマートサジェストの作り方.pdf
nakasho
0
150
8万デプロイ
iwamot
PRO
2
200
メタデータ同期に潜んでいた問題 〜 Cache Stampede 時の Cycle Wait を⾒つけた話
lycorptech_jp
PRO
0
150
聲の形にみるアクセシビリティ
tomokusaba
0
150
マルチアカウント環境でSecurity Hubの運用!導入の苦労とポイント / JAWS DAYS 2026
genda
0
120
ナレッジワークのご紹介(第88回情報処理学会 )
kworkdev
PRO
0
110
When an innocent-looking ListOffsets Call Took Down Our Kafka Cluster
lycorptech_jp
PRO
0
100
クラウド × シリコンの Mashup - AWS チップ開発で広がる AI 基盤の選択肢
htokoyo
2
100
Featured
See All Featured
How to Ace a Technical Interview
jacobian
281
24k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
330
The untapped power of vector embeddings
frankvandijk
2
1.6k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
60
42k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Designing for Performance
lara
611
70k
Balancing Empowerment & Direction
lara
5
930
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
290
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.7k
WENDY [Excerpt]
tessaabrams
9
36k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!