Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
NobuakiOshiro
PRO
July 10, 2025
Technology
1
140
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20260329_修正版_v2b_バブ・エル・マンデブ海峡封鎖リスクと日本のナフサ危機_AIシナリオ予測_AIレビュー付
doradora09
PRO
0
35
20260328_LT_花見会場をAIで探す
doradora09
PRO
0
60
20260328_中東情勢の2日差分_サマリ+レビュー付き
doradora09
PRO
0
37
20260326_中東情勢の1日差分+レビュー付き
doradora09
PRO
0
23
20260325_イラン情勢推移モニタリング
doradora09
PRO
0
27
20260323_5年後エネルギー再編シナリオ(ストレスシナリオの一つ)_ドラフト版
doradora09
PRO
0
25
20260322_ホ ル ム ズ ・ 紅 海 危 機 1 年 継 続 シ ナ リ オ と 「 時 間 切 れ 」マ ッ プ_ChatGPTレビュー付き
doradora09
PRO
0
62
20260319_中東危機予測の定量推移とビジネスインパクト(生成AIでのシナリオ予測)
doradora09
PRO
0
28
20260314_LT_ディープリサーチによるシナリオ予測.pdf
doradora09
PRO
0
93
Other Decks in Technology
See All in Technology
SaaSに宿る21g
kanyamaguc
2
180
昔話で振り返るAWSの歩み ~S3誕生から20年、クラウドはどう進化したのか~
nrinetcom
PRO
0
120
韓非子に学ぶAI活用術
tomfook
4
1.2k
AIにより大幅に強化された AWS Transform Customを触ってみる
0air
0
170
俺の/私の最強アーキテクチャ決定戦開催 ― チームで新しいアーキテクチャに適合していくために / 20260322 Naoki Takahashi
shift_evolve
PRO
1
470
「捨てる」を設計する
kubell_hr
0
450
QA組織のAI戦略とAIテスト設計システムAITASの実践
sansantech
PRO
1
250
The essence of decision-making lies in primary data
kaminashi
0
180
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
5
1.2k
RGBに陥らないために -プロダクトの価値を届けるまで-
righttouch
PRO
0
130
The Rise of Browser Automation: AI-Powered Web Interaction in 2026
marcthompson_seo
0
310
Microsoft Fabricで考える非構造データのAI活用
ryomaru0825
0
440
Featured
See All Featured
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
320
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
190
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
460
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
250
Designing Experiences People Love
moore
143
24k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
170
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.8k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
700
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
68
38k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
The Invisible Side of Design
smashingmag
302
51k
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!