Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
OpenTalks.AI - Дмитрий Пагин, Fast cars detecti...
Search
OpenTalks.AI
February 21, 2020
Science
0
2.1k
OpenTalks.AI - Дмитрий Пагин, Fast cars detection and traffic estimation
OpenTalks.AI
February 21, 2020
Tweet
Share
More Decks by OpenTalks.AI
See All by OpenTalks.AI
OpenTalks.AI - Виктор Лемпицкий, Моделирование 3Д сцен: новые подходы в 2020 году
opentalks
0
490
OpenTalks.AI - Алексей Чернявский, Нейросетевые алгоритмы для повышения качества медицинских изображений
opentalks
0
440
OpenTalks.AI - Александр Громов, Устойчивость нейросетевых моделей при анализе КТ/НДКТ-исследований
opentalks
0
380
OpenTalks.AI - Денис Тимонин, Megatron-LM: Обучение мультимиллиардных LMs при помощи техники Model Parallelism
opentalks
0
520
OpenTalks.AI - Егор Филимонов, Возможности платформы Huawei Atlas и эффективный гетерогенный инференс.
opentalks
0
160
OpenTalks.AI - Александр Прозоров, Референсная архитектура робота сервисного центра в отраслях с изменчивыми бизнес-процессами
opentalks
0
390
OpenTalks.AI - Наталья Лукашевич, Анализ тональности по отношению к компании — с чем не справился BERT
opentalks
0
340
OpenTalks.AI - Константин Воронцов, Фейковые новости и другие типы потенциально опасного дискурса: типология, подходы, датасеты, соревнования
opentalks
0
450
OpenTalks.AI - Дмитрий Ветров, Фрактальность функции потерь, эффект двойного спуска и степенные законы в глубинном обучении - фрагменты одной мозаики
opentalks
0
480
Other Decks in Science
See All in Science
データマイニング - ウェブとグラフ
trycycle
PRO
0
260
デジタルアーカイブの教育利用促進を目指したメタデータLOD基盤に関する研究 / Research on a Metadata LOD Platform for Promoting Educational Uses of Digital Archives
masao
0
180
データマイニング - グラフデータと経路
trycycle
PRO
1
310
AIによる科学の加速: 各領域での革新と共創の未来
masayamoriofficial
0
450
フィードフォワードニューラルネットワークを用いた記号入出力制御系に対する制御器設計 / Controller Design for Augmented Systems with Symbolic Inputs and Outputs Using Feedforward Neural Network
konakalab
0
100
データベース06: SQL (3/3) 副問い合わせ
trycycle
PRO
1
740
知能とはなにかーヒトとAIのあいだー
tagtag
PRO
0
170
機械学習 - K近傍法 & 機械学習のお作法
trycycle
PRO
0
1.4k
データマイニング - ノードの中心性
trycycle
PRO
0
350
コンピュータビジョンによるロボットの視覚と判断:宇宙空間での適応と課題
hf149
1
560
(メタ)科学コミュニケーターからみたAI for Scienceの同床異夢
rmaruy
0
180
My Little Monster
juzishuu
0
630
Featured
See All Featured
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
480
Ruling the World: When Life Gets Gamed
codingconduct
0
170
Leo the Paperboy
mayatellez
4
1.5k
So, you think you're a good person
axbom
PRO
2
1.9k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.1k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.3k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
67
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
ラッコキーワード サービス紹介資料
rakko
1
2.6M
Statistics for Hackers
jakevdp
799
230k
Transcript
Fast cars detection and traffic estimation Dmitriy Pagin, ML and
CV developer
Task Road traffic analysis in Russia is manual. It takes
more than 8 hours for 15 minutes video today
Task • detect cars
Task • detect cars • track cars
Baseline - people tracking
Problems Cars: - faster (2 metres per frame!) - smaller
(10 px in minimal dimension) + more predictable movement
YOLOv2 - blinking - problems on small cars - problems
on edges
YOLOv2 1 fps
YOLOv3 - bigger + accurate on small + fullHD frame
+ robust
YOLOv3 7 fps
> 70k cars on 4k images Dataset
better than 1024x1024x1 Learning and Fine-tuning - 608x608 px -
batchSize = 3 - custom augmenters
None
Learning and Fine-tuning - 608x608 px - batchSize = 3
- custom augmenters - Radam optimizer (instead warmup + reduce LR) - Hard negative mining for trucks
Learning and Fine-tuning - 608x608 px - batchSize = 3
- custom augmenters - Radam optimizer (instead warmup + reduce LR) - Hard negative mining for trucks mAP75 = 0.96
Baseline Inference Speed 7 fps
Weights Pruning
Weights Pruning -25% convs = size: 240 mb mAp: 0.9656
inf: 150 ms size: 155 mb mAp: 0.9622 inf: 100 ms 10 fps
OpticalFlow step or classical cv is alive ! - find
good features to track - calculate sparse optical flow
OpticalFlow step 19 fps Calculation doesnt work for 3 consistent
frames
Speed extrapolation step - estimate speed as pixels/frame - extrapolate
next position 28 fps
Final pipeline 1 2 3 4 5 6 Update trajectories
4 5 6 step 1 step 2 Speed Extrapolation OpticalFlow YOLOv3 Detection Engine
1 fps -> 28 fps on FULLHD
Tracking - IoU - Color descriptor (it’s enough!)
Bridges! - Allowed zone by motion vector - Size overlap
- Color descriptor
Bridges! - Allowed zone by motion vector - Size overlap
- Color descriptor
Thanks! Questions?
[email protected]
+7 952 335 65 70
Appendix. Examples
Appendix. Examples
Appendix. Examples
Appendix. Yolov3
Weights Pruning Шаг mAP75 Число параметров, млн Размер сети, мб
От изначальной, % Время прогона, мс Условие обрезания 0 0.965 60 241 100 150 - 1 0.962 55 218 91 140 5% от всех 2 0.962 50 197 83 132 5% от всех 3 0.963 39 155 64 112 15% для слоев с 400+ сверток 4 0.955 31 124 51 100 10% для слоев с 100+ сверток
Appendix. Radam
Pruning convs
Pruning convs. Good choice 2000
Pruning convs. Bad choice 25
Pruning flat