Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Mambaで物体検出 完全に理解した
Search
Reiki Shirasawa
July 29, 2025
Technology
2
130
Mambaで物体検出 完全に理解した
「エンジニア達の「完全に理解した」Talk #67」(
https://easy2.connpass.com/event/360405/
)にて発表させていただきました。
Reiki Shirasawa
July 29, 2025
Tweet
Share
Other Decks in Technology
See All in Technology
20250728 MCP, A2A and Multi-Agents in the future
yoshidashingo
1
160
人と生成AIの協調意思決定/Co‑decision making by people and generative AI
moriyuya
0
220
Unson OS|48時間で「売れるか」を判定する AI 市場検証プラットフォーム
unson
0
140
ecspressoの設計思想に至る道 / sekkeinight2025
fujiwara3
12
2.2k
Power Automate のパフォーマンス改善レシピ / Power Automate Performance Improvement Recipes
karamem0
0
280
Bet "Bet AI" - Accelerating Our AI Journey #BetAIDay
layerx
PRO
1
160
製造業の課題解決に向けた機械学習の活用と、製造業特化LLM開発への挑戦
knt44kw
0
110
人に寄り添うAIエージェントとアーキテクチャ #BetAIDay
layerx
PRO
1
130
猫でもわかるQ_CLI(CDK開発編)+ちょっとだけKiro
kentapapa
0
130
地域コミュニティへの「感謝」と「恩返し」 / 20250726jawsug-tochigi
kasacchiful
0
110
TypeScript 上達の道
ysknsid25
23
5k
LLM開発を支えるエヌビディアの生成AIエコシステム
acceleratedmu3n
0
350
Featured
See All Featured
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
The Cost Of JavaScript in 2023
addyosmani
51
8.7k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Gamification - CAS2011
davidbonilla
81
5.4k
How to train your dragon (web standard)
notwaldorf
96
6.1k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
How GitHub (no longer) Works
holman
314
140k
The Cult of Friendly URLs
andyhume
79
6.5k
Faster Mobile Websites
deanohume
308
31k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
139
34k
Scaling GitHub
holman
461
140k
Transcript
次世代のアーキテクチャ? Mambaで物体検出 完全に理解した Reiki Shirasawa エンジニア達の「完全に理解した」Talk #67 2025年7 月
29 日
自己 紹介 株式会社TechSword 製造領域の ノーコードAIプラットフォーム - エッジAI - 物体検出AI Reiki
Shirasawa @reikishirasawa
今 日 話す内容 - ふんわりした Mambaって何?なんで 生 まれたの? - ふんわりした
Mambaの画像認識(物体検出)分野への適 用 事例
世はTransformer時代 主要な 大 規模 言 語モデルは Transformer がベースになっている
画像認識の分野でも - DETR( 2 0 2 0 ) Transformer ×
物体検出の先駆け - Swin Transformer(2021) 軽量と 高 精度を両 立 したい - SAM(2023) ゼロショットでセグメンテーション
アーキテクチャの変遷 CNN Transformer ?
Transformerの課題 計算量 大 きくなりがち , はトークン 長 に関連 の計算が発 生
してしまう Q K N O(N2) Attention(Q, K, V) = softmax( QKT dk )V
もっと効率的に! でっかいコンテキスト 入 れたい
Mamba
ここがすごいぞMamba Mamba( 2 0 2 3 ) - 計算量が線形 にスケール
- 同サイズのTransformerの5倍速 O(N)
Mambaってどんなやつ? SSM(構造化状態空間モデル)を発展させたもの
SSMってどんなやつ? SSMの基本式 ht = ¯ Aht−1 + ¯ Bxt yt
= Cht 入力 とひとつ前の状態から 出 力 を決める
SSMの課題 必要な情報を選択する 力 が弱い Transformerの強みだった → 入力 の重要度がわからず全てフラットに 見 てしまう
Mambaの概要 入力 に応じてパラメータを変化させ どのくらい状態に反映させるかを決定 → 重要な部分に注 目 できない弱点を克服! 出典:https://arxiv.org/pdf/2312.00752
LLMにもMamba Codestral Mamba( 2 0 2 4 ) Mistral AI
- より 長 いコンテキスト 長 - より速い応答時間 https://mistral.ai/news/codestral-mamba
画像認識にもMamba Mamba YOLO( 2 0 2 4 ) - Mambaで物体検出してみた
- 画像の局所特徴を捉える 工 夫 - COCOデータセットでSOTA 出典:https://arxiv.org/pdf/2406.05835
物体検出にもMamba MambaNeXt-YOLO( 2 0 2 5 ) - CNNとのハイブリッド -
CNN:局所特徴得意 - Mamba: 長 距離依存得意 - リアルタイム ・ 低リソースな 環境で活躍するぞ! 出典:https://arxiv.org/pdf/2506.03654
まとめ - Mamba が画像認識(物体検出)の分野でも注 目 - これから普及が進んでいったら 面白 いね