Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
NobuakiOshiro
PRO
July 10, 2025
Technology
150
1
Share
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20260512_イラン情勢_物流アップデート
doradora09
PRO
0
43
20260513_生成AIを専属DSに_AI分析結果の検品テクニック_ハンズオン_交通事故データ
doradora09
PRO
0
210
20260509_ぼちぼちアプリ版Codex_and_CLI入門
doradora09
PRO
0
91
20260507_今週の中東情勢・物流統合レポート_NOBDATA
doradora09
PRO
0
43
20260507_中東有事後のグローバル資源需給_AI調査
doradora09
PRO
0
53
20260501_ITエンジニアさん向け_分析基盤・データ活用概論
doradora09
PRO
0
50
20260430_週次モニタリング_統合版スライド
doradora09
PRO
0
33
20260422_中東情勢・物流週次モニタリング
doradora09
PRO
0
72
20260415_生成AIを専属DSに_自動レポート作成_ハンズオン_交通事故データ
doradora09
PRO
0
330
Other Decks in Technology
See All in Technology
Anthropic「Long-running a gents」をGeminiで再現してみた
tkikuchi
0
790
2026年春のAgentCoreアプデ 細かいやつ全部まとめ
minorun365
3
200
AIの揺らぎに“コシ”を与える階層化品質設計
ickx
0
270
大学職員のための生成AI最前線 :最前線を、AIガバナンスとして読み直すためのTips
gmoriki
2
3.9k
MySQL 9.7がやってきた ~これまでのあらすじと基本情報~ @ 日本MySQLユーザ会会2026年04月 / mysql97-yattekita
sakaik
0
180
Digital Independence: Why, When and How
wannesrams
0
300
ServiceによるKubernetes通信制御ーClusterIPを例に
miku01
1
150
AIが盛んな時代に 技術記事を書き始めて起きた私の中での小さな変化
peintangos
0
360
【技術書典20】OpenFOAM(自宅で深める流体解析)流れと熱移動(2)
kamakiri1225
0
380
みんなの考えた最強のデータ基盤アーキテクチャ'26前期〜前夜祭〜ルーキーズ_資料_遠藤な
endonanana
0
130
会社説明資料|株式会社ギークプラス ソフトウェア事業部
geekplus_tech
0
200
世界の中心でApp Runnerを叫ぶ FINAL
tsukuboshi
0
250
Featured
See All Featured
ラッコキーワード サービス紹介資料
rakko
1
3.2M
Facilitating Awesome Meetings
lara
57
6.8k
For a Future-Friendly Web
brad_frost
183
10k
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.9k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
800
Java REST API Framework Comparison - PWX 2021
mraible
34
9.3k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
A Soul's Torment
seathinner
6
2.8k
エンジニアに許された特別な時間の終わり
watany
106
240k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
100
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
360
How to make the Groovebox
asonas
2
2.2k
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!