Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Что делать, если данных мало?
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Big Data & AI Conference 2020
September 17, 2020
Business
0
73
Что делать, если данных мало?
Наталья Полковникова, генеральный директор, ООО "Институт прикладной математики и информатики"
Big Data & AI Conference 2020
September 17, 2020
Tweet
Share
More Decks by Big Data & AI Conference 2020
See All by Big Data & AI Conference 2020
Как искусственный интеллект помогает снизить вредные выбросы в атмосферу на металлургическом производстве.
aiconforg
0
100
Как сломать рекламную индустрию: повышаем эффективность рекламы с помощью Emotion Recognition
aiconforg
0
66
Цифровой помощник для маневрового диспетчера
aiconforg
0
300
Прогресс ученика: Как анализ больших данных помогает быстрее и дешевле достичь образовательных целей
aiconforg
0
120
Рекомендательная система для увеличения кросс-продаж: опыт инвестиционной компании
aiconforg
0
40
Дополненная аналитика: практический подход к автоматизации внутренней аналитики
aiconforg
1
54
Построение системы realtime-аналитики на ClickHouse
aiconforg
0
180
Как оценить эмоциональную реакцию на рекламу дистанционно, быстро и точно.
aiconforg
0
79
Учет новых слов в языковых моделях классификации
aiconforg
0
49
Other Decks in Business
See All in Business
経営管理について / About Corporate Planning
loglass2019
0
7.4k
ファブリカホールディングス_2026年3月期第3四半期説明資料
fabrica_com
1
5.5k
株式会社High Link_会社紹介資料
highlink_hr
2
81k
【Progmat】Monthly-ST-Market-Report-2026-Jan.
progmat
0
340
20251228_「言った」を「動いた」に変える 伝える力・5段階レベルアップ研修_社内研修資料
tomoyuki1188
PRO
1
130
20260114_知的生産と事業創造でAIを使いこなす全技法_スライド
itarutomy
1
490
GMO Flatt Security 会社紹介資料
flatt_security
0
27k
giftee_Company introduction Febrary 2026
recruit_giftee
1
610
re:Invent2025 re:Cap 〜技術的負債解消と AWS Transform Customと わたし〜
maijun
0
140
株式会社ネオキャリア_採用ピッチ資料_20260128
neo_recruit
0
670
アシスト 会社紹介資料
ashisuto_career
3
150k
2026年3月7日(土)放射性金属がやってくるか 廃炉原発等のクリアランスについて
atsukomasano2026
0
270
Featured
See All Featured
The Cult of Friendly URLs
andyhume
79
6.8k
How to build a perfect <img>
jonoalderson
1
4.9k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
9.9k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
120
How to make the Groovebox
asonas
2
1.9k
The Cost Of JavaScript in 2023
addyosmani
55
9.5k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.6k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
The Language of Interfaces
destraynor
162
26k
Site-Speed That Sticks
csswizardry
13
1.1k
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
440
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Transcript
Что делать если данных мало? Наталья Полковникова Институт прикладной математики
и информатики
[email protected]
+7 495 185 58 64
Типичные проблемы цифровой трансформации реального бизнеса ЧТО ДЕЛАТЬ? Данных мало
Типичный пример – лизинговая компания с относительно не большим количеством клиентов Данные есть, но в них мало интересующих нас событий Типичный пример данные по увольнениям х х х х х х х х х х х х х х х х х ✓
Внешние источники • Социальные сети • Спакр • Данные агентства
кредитных историй …….
Проблемы
Что делать если данные все равно не сбалансированы? Oversampling Undersampling
Примеры из реальной жизни Увольнения сотрудников
Данные по клиентам/сотрудникам До SMOTE После SMOTE Имеют некоторое распределение
Целевой показатель
Статистика хорошая. Но что получили? Но мы же хотели поймать
красных! Статистика, описывающая работу моделей в среднем по 2 классам
До SMOTE После SMOTE
Какая модель нам подходит?
Примеры из реальной жизни Лизинг
До обработки данных После чистки и обогащения данных
Главное не переобучиться!
Вопросы? Наталья Полковникова Генеральный директор Институт прикладной математики и информатики
[email protected]
/ +7 495 185 58 64