Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Что делать, если данных мало?
Search
Big Data & AI Conference 2020
September 17, 2020
Business
0
48
Что делать, если данных мало?
Наталья Полковникова, генеральный директор, ООО "Институт прикладной математики и информатики"
Big Data & AI Conference 2020
September 17, 2020
Tweet
Share
More Decks by Big Data & AI Conference 2020
See All by Big Data & AI Conference 2020
Как искусственный интеллект помогает снизить вредные выбросы в атмосферу на металлургическом производстве.
aiconforg
0
66
Как сломать рекламную индустрию: повышаем эффективность рекламы с помощью Emotion Recognition
aiconforg
0
50
Цифровой помощник для маневрового диспетчера
aiconforg
0
200
Прогресс ученика: Как анализ больших данных помогает быстрее и дешевле достичь образовательных целей
aiconforg
0
82
Рекомендательная система для увеличения кросс-продаж: опыт инвестиционной компании
aiconforg
0
34
Дополненная аналитика: практический подход к автоматизации внутренней аналитики
aiconforg
1
43
Построение системы realtime-аналитики на ClickHouse
aiconforg
0
130
Как оценить эмоциональную реакцию на рекламу дистанционно, быстро и точно.
aiconforg
0
61
Учет новых слов в языковых моделях классификации
aiconforg
0
40
Other Decks in Business
See All in Business
TECH HIRE |「大胆なポジションの開発」によって ハイクラス人材を直接応募で4名採用できた話
trackrecords
PRO
0
370
plan-renewal-freee-2024
yuki_yano
PRO
0
140
会社説明について~株式会社リハス~
re9010matsubara
0
190
regions_recruit
regions
0
110
AHV環境で利用できるネットワーク/セキュリティ
kuze_k
0
120
プライシングについて②
umzws
0
270
採用ピッチブック
macloud
2
48k
2024年度採用資料
tcmktdev
0
160
20240401 新卒研修 - ピクシブにおける技術領域
harukasan
PRO
1
540
NAGANO STARTUP STUDIO_ introduction
1romatsuhisa
0
280
ジンジニアのキャリア ~てぃーびーの場合~ / Tb's career
tbpgr
0
450
エンジニア向け会社説明資料
staffrecruiter
2
390
Featured
See All Featured
Ruby is Unlike a Banana
tanoku
96
10k
Music & Morning Musume
bryan
41
5.6k
Building Effective Engineering Teams - LeadDev
addyosmani
32
1.9k
Statistics for Hackers
jakevdp
790
220k
Principles of Awesome APIs and How to Build Them.
keavy
121
16k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
20
1.7k
Why You Should Never Use an ORM
jnunemaker
PRO
51
8.7k
Design by the Numbers
sachag
274
18k
Infographics Made Easy
chrislema
238
18k
Fontdeck: Realign not Redesign
paulrobertlloyd
76
4.9k
Testing 201, or: Great Expectations
jmmastey
30
6.4k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
13
8.3k
Transcript
Что делать если данных мало? Наталья Полковникова Институт прикладной математики
и информатики
[email protected]
+7 495 185 58 64
Типичные проблемы цифровой трансформации реального бизнеса ЧТО ДЕЛАТЬ? Данных мало
Типичный пример – лизинговая компания с относительно не большим количеством клиентов Данные есть, но в них мало интересующих нас событий Типичный пример данные по увольнениям х х х х х х х х х х х х х х х х х ✓
Внешние источники • Социальные сети • Спакр • Данные агентства
кредитных историй …….
Проблемы
Что делать если данные все равно не сбалансированы? Oversampling Undersampling
Примеры из реальной жизни Увольнения сотрудников
Данные по клиентам/сотрудникам До SMOTE После SMOTE Имеют некоторое распределение
Целевой показатель
Статистика хорошая. Но что получили? Но мы же хотели поймать
красных! Статистика, описывающая работу моделей в среднем по 2 классам
До SMOTE После SMOTE
Какая модель нам подходит?
Примеры из реальной жизни Лизинг
До обработки данных После чистки и обогащения данных
Главное не переобучиться!
Вопросы? Наталья Полковникова Генеральный директор Институт прикладной математики и информатики
[email protected]
/ +7 495 185 58 64