Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Mambaで物体検出 完全に理解した
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Reiki Shirasawa
July 29, 2025
Technology
2
620
Mambaで物体検出 完全に理解した
「エンジニア達の「完全に理解した」Talk #67」(
https://easy2.connpass.com/event/360405/
)にて発表させていただきました。
Reiki Shirasawa
July 29, 2025
Tweet
Share
Other Decks in Technology
See All in Technology
技術的負債の泥沼から組織を救う3つの転換点
nwiizo
8
3.5k
A Gentle Introduction to Transformers
keio_smilab
PRO
2
1k
AWS DevOps Agent vs SRE俺 / AWS DevOps Agent vs me, the SRE
sms_tech
3
530
Datadog の RBAC のすべて
nulabinc
PRO
3
440
JAWS DAYS 2026 ExaWizards_20260307
exawizards
0
400
us-east-1 に障害が起きた時に、 ap-northeast-1 にどんな影響があるか 説明できるようになろう!
miu_crescent
PRO
13
4.2k
2026-03-11 JAWS-UG 茨城 #12 改めてALBを便利に使う
masasuzu
2
340
Evolution of Claude Code & How to use features
oikon48
1
580
白金鉱業Meetup_Vol.22_Orbital Senseを支える衛星画像のマルチモーダルエンベディングと地理空間のあいまい検索技術
brainpadpr
2
290
Dr. Werner Vogelsの14年のキーノートから紐解くエンジニアリング組織への処方箋@JAWS DAYS 2026
p0n
1
130
PMBOK第8版は第7版から何が変わったのか(PMBOK第8版概要解説) / 20260304 Takeshi Watarai
shift_evolve
PRO
0
200
Oracle Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
3
1.7k
Featured
See All Featured
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.4k
First, design no harm
axbom
PRO
2
1.1k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.2k
Amusing Abliteration
ianozsvald
0
130
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
380
The Curse of the Amulet
leimatthew05
1
9.8k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
120
Become a Pro
speakerdeck
PRO
31
5.8k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
140
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
460
How to make the Groovebox
asonas
2
2k
Building the Perfect Custom Keyboard
takai
2
710
Transcript
次世代のアーキテクチャ? Mambaで物体検出 完全に理解した Reiki Shirasawa エンジニア達の「完全に理解した」Talk #67 2025年7 月
29 日
自己 紹介 株式会社TechSword 製造領域の ノーコードAIプラットフォーム - エッジAI - 物体検出AI Reiki
Shirasawa @reikishirasawa
今 日 話す内容 - ふんわりした Mambaって何?なんで 生 まれたの? - ふんわりした
Mambaの画像認識(物体検出)分野への適 用 事例
世はTransformer時代 主要な 大 規模 言 語モデルは Transformer がベースになっている
画像認識の分野でも - DETR( 2 0 2 0 ) Transformer ×
物体検出の先駆け - Swin Transformer(2021) 軽量と 高 精度を両 立 したい - SAM(2023) ゼロショットでセグメンテーション
アーキテクチャの変遷 CNN Transformer ?
Transformerの課題 計算量 大 きくなりがち , はトークン 長 に関連 の計算が発 生
してしまう Q K N O(N2) Attention(Q, K, V) = softmax( QKT dk )V
もっと効率的に! でっかいコンテキスト 入 れたい
Mamba
ここがすごいぞMamba Mamba( 2 0 2 3 ) - 計算量が線形 にスケール
- 同サイズのTransformerの5倍速 O(N)
Mambaってどんなやつ? SSM(構造化状態空間モデル)を発展させたもの
SSMってどんなやつ? SSMの基本式 ht = ¯ Aht−1 + ¯ Bxt yt
= Cht 入力 とひとつ前の状態から 出 力 を決める
SSMの課題 必要な情報を選択する 力 が弱い Transformerの強みだった → 入力 の重要度がわからず全てフラットに 見 てしまう
Mambaの概要 入力 に応じてパラメータを変化させ どのくらい状態に反映させるかを決定 → 重要な部分に注 目 できない弱点を克服! 出典:https://arxiv.org/pdf/2312.00752
LLMにもMamba Codestral Mamba( 2 0 2 4 ) Mistral AI
- より 長 いコンテキスト 長 - より速い応答時間 https://mistral.ai/news/codestral-mamba
画像認識にもMamba Mamba YOLO( 2 0 2 4 ) - Mambaで物体検出してみた
- 画像の局所特徴を捉える 工 夫 - COCOデータセットでSOTA 出典:https://arxiv.org/pdf/2406.05835
物体検出にもMamba MambaNeXt-YOLO( 2 0 2 5 ) - CNNとのハイブリッド -
CNN:局所特徴得意 - Mamba: 長 距離依存得意 - リアルタイム ・ 低リソースな 環境で活躍するぞ! 出典:https://arxiv.org/pdf/2506.03654
まとめ - Mamba が画像認識(物体検出)の分野でも注 目 - これから普及が進んでいったら 面白 いね