Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Поиск аномалий в потоковых данных
Search
Михаил Васильев
July 22, 2025
Programming
6
0
Share
Поиск аномалий в потоковых данных
Доклад на митапе PythoNN 8 (2025)
Михаил Васильев
July 22, 2025
More Decks by Михаил Васильев
See All by Михаил Васильев
Anomaly Detection with Python
slauton1234
0
50
Классификация новостных текстов с присвоением тегов
slauton1234
0
57
Интеллектуальный помощник оператора службы поддержки
slauton1234
0
48
Other Decks in Programming
See All in Programming
Linux Kernelの1文字のミスで 権限昇格ができた話
rqda
0
2.2k
Mastering Event Sourcing: Your Parents Holidayed in Yugoslavia
super_marek
0
130
AIコードレビューの導入・運用と AI駆動開発における「AI4QA」の取り組みについて
hagevvashi
0
590
SkillがSkillを生む:QA観点出しを自動化した
sontixyou
1
220
我々はなぜ「層」を分けるのか〜「関心の分離」と「抽象化」で手に入れる変更に強いシンプルな設計〜 #phperkaigi / PHPerKaigi 2026
shogogg
2
760
OTP を自動で入力する裏技
megabitsenmzq
0
130
コードレビューをしない選択 #でぃーぷらすトウキョウ
kajitack
3
1.3k
Cyrius ーLinux非依存にコンテナをネイティブ実行する専用OSー
n4mlz
0
270
Reactive ❤️ Loom: A Forbidden Love Story
franz1981
2
210
GC言語のWasm化とComponent Modelサポートの実践と課題 - Scalaの場合
tanishiking
0
140
AI Assistants for YourAngular Solutions @Angular Graz, March 2026
manfredsteyer
PRO
0
140
How to stabilize UI tests using XCTest
akkeylab
0
150
Featured
See All Featured
Odyssey Design
rkendrick25
PRO
2
560
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
370
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
260
Code Reviewing Like a Champion
maltzj
528
40k
A Modern Web Designer's Workflow
chriscoyier
698
190k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
HDC tutorial
michielstock
1
600
How Software Deployment tools have changed in the past 20 years
geshan
0
33k
The Invisible Side of Design
smashingmag
302
51k
Building AI with AI
inesmontani
PRO
1
850
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
Transcript
Аномалии в потоковых данных алгоритмы под капотом
Обо мне • Старший специалист по машинному обучению • deep
learning engineer • NLP, CV, anomaly detection • Open source contributor • Амбассадор Яндекс Практикума
Аномалии
None
попугаи удавы 3.248357 -2.874754 2.930868 -2.826776 3.323844 -3.340012 3.761515 -2.883873
2.882923 -2.853464 2.882932 -3.357176 3.789606 -2.067113 … …
попугаи удавы 3.248357 -2.874754 2.930868 -2.826776 3.323844 -3.340012 3.761515 -2.883873
2.882923 -2.853464 2.882932 -3.357176 3.789606 -2.067113 … … индекс аномальности -0.119150 -0.131275 -0.108670 -0.065472 -0.128972 -0.120056 -0.012170 …
None
Threshold
None
None
None
None
None
Потоковые данные
pip install pysad from pysad.models import IForestASD model = IForestASD()
for x in streaming_data: anomaly_score = model.fit_score_partial(x)
Ансамбли
Делим
Обучаем
Усредняем
None
None
In [1]: import random In [2]: axes = ['попугаи', 'удавы']
In [3]: random.choice(axes) Out[3]: 'удавы' In [4]: random.uniform(df['удавы'].min(), df['удавы'].max()) Out[4]: 3.954197818641566
… In [5]: random.choice(axes) Out[5]: 'попугаи' In [6]: random.uniform(df_b['попугаи'].min(), df_b['попугаи'].max())
Out[6]: -3.7345546743319455
… In [7]: random.choice(axes) Out[7]: 'попугаи' In [8]: random.uniform(df_bl['попугаи'].min(), df_bl['попугаи'].max())
Out[8]: 4.55352143693694
… In [9]: random.choice(axes) Out[9]: 'удавы' In [10]: random.uniform(df_br['удавы'].min(), df_br['удавы'].max())
Out[10]: -0.6572094533790986
iTree
Isolation Forest
Isolation Forest
Алгоритм Fei Tony Liu, Kai Ming Ting, and Zhi-Hua Zhou.
Isolation forest. In Data Mining, 2008. ICDM'08. Eighth IEEE International Conference on, 413–422. IEEE, 2008.
Потоковые данные Zhiguo Ding and Minrui Fei. An anomaly detection
approach based on isolation forest algorithm for streaming data using sliding window. IFAC Proceedings Volumes, 46(20):12–17, 2013.
None
None
None
None
None
None
None
Алгоритм
None
None
None
None
None
None
Алгоритм в pysad Emaad Manzoor, Hemank Lamba, and Leman Akoglu.
Xstream: outlier detection in feature-evolving data streams. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 1963–1972. 2018.
Резюме
Вопросы?