Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Поиск аномалий в потоковых данных
Search
Михаил Васильев
July 22, 2025
Programming
0
4
Поиск аномалий в потоковых данных
Доклад на митапе PythoNN 8 (2025)
Михаил Васильев
July 22, 2025
Tweet
Share
More Decks by Михаил Васильев
See All by Михаил Васильев
Anomaly Detection with Python
slauton1234
0
36
Классификация новостных текстов с присвоением тегов
slauton1234
0
55
Интеллектуальный помощник оператора службы поддержки
slauton1234
0
42
Other Decks in Programming
See All in Programming
Denoのセキュリティに関する仕組みの紹介 (toranoana.deno #23)
uki00a
0
260
AI前提で考えるiOSアプリのモダナイズ設計
yuukiw00w
0
220
フロントエンド開発の勘所 -複数事業を経験して見えた判断軸の違い-
heimusu
7
2.7k
【卒業研究】会話ログ分析によるユーザーごとの関心に応じた話題提案手法
momok47
0
180
CSC307 Lecture 04
javiergs
PRO
0
650
Basic Architectures
denyspoltorak
0
630
AIで開発はどれくらい加速したのか?AIエージェントによるコード生成を、現場の評価と研究開発の評価の両面からdeep diveしてみる
daisuketakeda
1
920
re:Invent 2025 のイケてるサービスを紹介する
maroon1st
0
170
2026年 エンジニアリング自己学習法
yumechi
0
110
[KNOTS 2026登壇資料]AIで拡張‧交差する プロダクト開発のプロセス および携わるメンバーの役割
hisatake
0
180
実は歴史的なアップデートだと思う AWS Interconnect - multicloud
maroon1st
0
360
Python札幌 LT資料
t3tra
7
1.1k
Featured
See All Featured
Utilizing Notion as your number one productivity tool
mfonobong
2
200
SEO for Brand Visibility & Recognition
aleyda
0
4.2k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
0
130
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
50
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
130
The SEO identity crisis: Don't let AI make you average
varn
0
57
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
A designer walks into a library…
pauljervisheath
210
24k
Chasing Engaging Ingredients in Design
codingconduct
0
110
A Soul's Torment
seathinner
5
2.2k
The agentic SEO stack - context over prompts
schlessera
0
600
Deep Space Network (abreviated)
tonyrice
0
36
Transcript
Аномалии в потоковых данных алгоритмы под капотом
Обо мне • Старший специалист по машинному обучению • deep
learning engineer • NLP, CV, anomaly detection • Open source contributor • Амбассадор Яндекс Практикума
Аномалии
None
попугаи удавы 3.248357 -2.874754 2.930868 -2.826776 3.323844 -3.340012 3.761515 -2.883873
2.882923 -2.853464 2.882932 -3.357176 3.789606 -2.067113 … …
попугаи удавы 3.248357 -2.874754 2.930868 -2.826776 3.323844 -3.340012 3.761515 -2.883873
2.882923 -2.853464 2.882932 -3.357176 3.789606 -2.067113 … … индекс аномальности -0.119150 -0.131275 -0.108670 -0.065472 -0.128972 -0.120056 -0.012170 …
None
Threshold
None
None
None
None
None
Потоковые данные
pip install pysad from pysad.models import IForestASD model = IForestASD()
for x in streaming_data: anomaly_score = model.fit_score_partial(x)
Ансамбли
Делим
Обучаем
Усредняем
None
None
In [1]: import random In [2]: axes = ['попугаи', 'удавы']
In [3]: random.choice(axes) Out[3]: 'удавы' In [4]: random.uniform(df['удавы'].min(), df['удавы'].max()) Out[4]: 3.954197818641566
… In [5]: random.choice(axes) Out[5]: 'попугаи' In [6]: random.uniform(df_b['попугаи'].min(), df_b['попугаи'].max())
Out[6]: -3.7345546743319455
… In [7]: random.choice(axes) Out[7]: 'попугаи' In [8]: random.uniform(df_bl['попугаи'].min(), df_bl['попугаи'].max())
Out[8]: 4.55352143693694
… In [9]: random.choice(axes) Out[9]: 'удавы' In [10]: random.uniform(df_br['удавы'].min(), df_br['удавы'].max())
Out[10]: -0.6572094533790986
iTree
Isolation Forest
Isolation Forest
Алгоритм Fei Tony Liu, Kai Ming Ting, and Zhi-Hua Zhou.
Isolation forest. In Data Mining, 2008. ICDM'08. Eighth IEEE International Conference on, 413–422. IEEE, 2008.
Потоковые данные Zhiguo Ding and Minrui Fei. An anomaly detection
approach based on isolation forest algorithm for streaming data using sliding window. IFAC Proceedings Volumes, 46(20):12–17, 2013.
None
None
None
None
None
None
None
Алгоритм
None
None
None
None
None
None
Алгоритм в pysad Emaad Manzoor, Hemank Lamba, and Leman Akoglu.
Xstream: outlier detection in feature-evolving data streams. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 1963–1972. 2018.
Резюме
Вопросы?