Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Поиск аномалий в потоковых данных
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Михаил Васильев
July 22, 2025
Programming
6
0
Share
Поиск аномалий в потоковых данных
Доклад на митапе PythoNN 8 (2025)
Михаил Васильев
July 22, 2025
More Decks by Михаил Васильев
See All by Михаил Васильев
Anomaly Detection with Python
slauton1234
0
53
Классификация новостных текстов с присвоением тегов
slauton1234
0
60
Интеллектуальный помощник оператора службы поддержки
slauton1234
0
49
Other Decks in Programming
See All in Programming
JOAI2026 1st solution - heron0519 -
heron0519
0
140
mruby on C#: From VM Implementation to Game Scripting (RubyKaigi 2026)
hadashia
2
550
AIベース静的検査器の偽陽性率を抑える工夫3選
orgachem
PRO
3
320
10年分の技術的負債、完済へ ― Claude Code主導のAI駆動開発でスポーツブルを丸ごとリプレイスした話
takuya_houshima
0
2.6k
Xdebug と IDE による デバッグ実行の仕組みを見る / Exploring-How-Debugging-Works-with-Xdebug-and-an-IDE
shin1x1
0
380
ハーネスエンジニアリングにどう向き合うか 〜ルールファイルを超えて開発プロセスを設計する〜 / How to approach harness engineering
rkaga
23
13k
iOS機能開発のAI環境と起きた変化
ryunakayama
0
180
JAWS-UG横浜 #100 祝・第100回スペシャルAWS は VPC レスの時代へ
maroon1st
0
150
ルールルルルルRubyの中身の予備知識 ── RubyKaigiの前に予習しなイカ?
ydah
1
190
AIエージェントで業務改善してみた
taku271
0
530
ハーネスエンジニアリングとは?
kinopeee
11
5.4k
CDK Deployのための ”反響定位”
watany
4
780
Featured
See All Featured
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
150
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
440
The Cult of Friendly URLs
andyhume
79
6.8k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.8k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.7k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.9k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
260
Code Reviewing Like a Champion
maltzj
528
40k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
320
Transcript
Аномалии в потоковых данных алгоритмы под капотом
Обо мне • Старший специалист по машинному обучению • deep
learning engineer • NLP, CV, anomaly detection • Open source contributor • Амбассадор Яндекс Практикума
Аномалии
None
попугаи удавы 3.248357 -2.874754 2.930868 -2.826776 3.323844 -3.340012 3.761515 -2.883873
2.882923 -2.853464 2.882932 -3.357176 3.789606 -2.067113 … …
попугаи удавы 3.248357 -2.874754 2.930868 -2.826776 3.323844 -3.340012 3.761515 -2.883873
2.882923 -2.853464 2.882932 -3.357176 3.789606 -2.067113 … … индекс аномальности -0.119150 -0.131275 -0.108670 -0.065472 -0.128972 -0.120056 -0.012170 …
None
Threshold
None
None
None
None
None
Потоковые данные
pip install pysad from pysad.models import IForestASD model = IForestASD()
for x in streaming_data: anomaly_score = model.fit_score_partial(x)
Ансамбли
Делим
Обучаем
Усредняем
None
None
In [1]: import random In [2]: axes = ['попугаи', 'удавы']
In [3]: random.choice(axes) Out[3]: 'удавы' In [4]: random.uniform(df['удавы'].min(), df['удавы'].max()) Out[4]: 3.954197818641566
… In [5]: random.choice(axes) Out[5]: 'попугаи' In [6]: random.uniform(df_b['попугаи'].min(), df_b['попугаи'].max())
Out[6]: -3.7345546743319455
… In [7]: random.choice(axes) Out[7]: 'попугаи' In [8]: random.uniform(df_bl['попугаи'].min(), df_bl['попугаи'].max())
Out[8]: 4.55352143693694
… In [9]: random.choice(axes) Out[9]: 'удавы' In [10]: random.uniform(df_br['удавы'].min(), df_br['удавы'].max())
Out[10]: -0.6572094533790986
iTree
Isolation Forest
Isolation Forest
Алгоритм Fei Tony Liu, Kai Ming Ting, and Zhi-Hua Zhou.
Isolation forest. In Data Mining, 2008. ICDM'08. Eighth IEEE International Conference on, 413–422. IEEE, 2008.
Потоковые данные Zhiguo Ding and Minrui Fei. An anomaly detection
approach based on isolation forest algorithm for streaming data using sliding window. IFAC Proceedings Volumes, 46(20):12–17, 2013.
None
None
None
None
None
None
None
Алгоритм
None
None
None
None
None
None
Алгоритм в pysad Emaad Manzoor, Hemank Lamba, and Leman Akoglu.
Xstream: outlier detection in feature-evolving data streams. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 1963–1972. 2018.
Резюме
Вопросы?