Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
NobuakiOshiro
PRO
July 10, 2025
Technology
140
1
Share
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20260422_中東情勢・物流週次モニタリング
doradora09
PRO
0
37
20260415_生成AIを専属DSに_自動レポート作成_ハンズオン_交通事故データ
doradora09
PRO
0
110
20260414_イラン情勢1ヶ月の4つのレポート事後評価(β版)
doradora09
PRO
0
14
20260412_生成AIとの付き合い方_上手に使うためのヒント
doradora09
PRO
0
23
20260404_3年W封鎖ケースシミュレーション_サマリとレビュー付き
doradora09
PRO
0
41
20260404_4つのLLMでのイラン情勢予測_統合版_レビュー付き
doradora09
PRO
0
45
20260404_医療関係へのイラン情勢への影響モニタリング_レビュー付き
doradora09
PRO
0
79
20260403_(簡易)AI欠品予測レポートの作り方_大城.pdf
doradora09
PRO
0
67
20260329_修正版_v2b_バブ・エル・マンデブ海峡封鎖リスクと日本のナフサ危機_AIシナリオ予測_AIレビュー付
doradora09
PRO
0
46
Other Decks in Technology
See All in Technology
ARIA Notifyについて
ryokatsuse
1
120
猫でもわかるKiro CLI(CDKコーディング編)
kentapapa
1
130
社内エンジニア勉強会の醍醐味と苦しみ/tamadev
nishiuma
0
140
こんなアーキテクチャ図はいやだ / Anti-pattern in AWS Architecture Diagrams
naospon
1
430
The Journey of Box Building
tagomoris
4
390
ネットワーク運用を楽にするAWS DevOps Agent活用法!! / 20260421 Masaki Okuda
shift_evolve
PRO
2
190
昔はシンプルだった_AmazonS3
kawaji_scratch
0
320
え!?初参加で 300冊以上 も頒布!? これは大成功!そのはずなのに わいの財布は 赤字 の件
hellohazime
0
160
20260423_執筆の工夫と裏側 技術書の企画から刊行まで / From the planning to the publication of technical book
nash_efp
1
360
20年前の「OSS革命」に学ぶ AI時代の生存戦略
samakada
0
290
Revisiting [CLS] and Patch Token Interaction in Vision Transformers
yu4u
0
330
QGISプラグイン CMChangeDetector
naokimuroki
1
340
Featured
See All Featured
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
The browser strikes back
jonoalderson
0
970
Tell your own story through comics
letsgokoyo
1
890
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
230
Mobile First: as difficult as doing things right
swwweet
225
10k
Technical Leadership for Architectural Decision Making
baasie
3
320
How to Think Like a Performance Engineer
csswizardry
28
2.5k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
220
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
BBQ
matthewcrist
89
10k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
710
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
260
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!