Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Что делать, если данных мало?
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Big Data & AI Conference 2020
September 17, 2020
Business
0
73
Что делать, если данных мало?
Наталья Полковникова, генеральный директор, ООО "Институт прикладной математики и информатики"
Big Data & AI Conference 2020
September 17, 2020
Tweet
Share
More Decks by Big Data & AI Conference 2020
See All by Big Data & AI Conference 2020
Как искусственный интеллект помогает снизить вредные выбросы в атмосферу на металлургическом производстве.
aiconforg
0
100
Как сломать рекламную индустрию: повышаем эффективность рекламы с помощью Emotion Recognition
aiconforg
0
66
Цифровой помощник для маневрового диспетчера
aiconforg
0
300
Прогресс ученика: Как анализ больших данных помогает быстрее и дешевле достичь образовательных целей
aiconforg
0
120
Рекомендательная система для увеличения кросс-продаж: опыт инвестиционной компании
aiconforg
0
40
Дополненная аналитика: практический подход к автоматизации внутренней аналитики
aiconforg
1
54
Построение системы realtime-аналитики на ClickHouse
aiconforg
0
180
Как оценить эмоциональную реакцию на рекламу дистанционно, быстро и точно.
aiconforg
0
79
Учет новых слов в языковых моделях классификации
aiconforg
0
49
Other Decks in Business
See All in Business
会社説明資料
xinghr
0
230
採用ピッチ資料
s_kamada
0
410
Women in Agile Tokyo2026 「個をあるがままに生かす」は綺麗事でも簡単なことでもなかった
nekoyanagi
0
170
ノッカリアドベントカレンダー全記録まとめ
szkm555
0
130
【新卒向け】株式会社リブに興味のある方へ
libinc
0
11k
株式会社Oxxx Culture Deck
oxxxinc
0
690
LW_brochure_business
lincwellhr
1
75k
CC採用候補者向けピッチ資料
crosscommunication
2
57k
Sreake事業部説明資料
3shake
0
450
株式会社EventHub 会社紹介資料
eventhub
1
44k
株式会社ボスコ・テクノロジーズ Company Deck
boscotechrecruit
0
4.5k
20251228_「言った」を「動いた」に変える 伝える力・5段階レベルアップ研修_社内研修資料
tomoyuki1188
PRO
1
130
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
190
Statistics for Hackers
jakevdp
799
230k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
200
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.4k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.1k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
Marketing to machines
jonoalderson
1
4.6k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
52
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Transcript
Что делать если данных мало? Наталья Полковникова Институт прикладной математики
и информатики
[email protected]
+7 495 185 58 64
Типичные проблемы цифровой трансформации реального бизнеса ЧТО ДЕЛАТЬ? Данных мало
Типичный пример – лизинговая компания с относительно не большим количеством клиентов Данные есть, но в них мало интересующих нас событий Типичный пример данные по увольнениям х х х х х х х х х х х х х х х х х ✓
Внешние источники • Социальные сети • Спакр • Данные агентства
кредитных историй …….
Проблемы
Что делать если данные все равно не сбалансированы? Oversampling Undersampling
Примеры из реальной жизни Увольнения сотрудников
Данные по клиентам/сотрудникам До SMOTE После SMOTE Имеют некоторое распределение
Целевой показатель
Статистика хорошая. Но что получили? Но мы же хотели поймать
красных! Статистика, описывающая работу моделей в среднем по 2 классам
До SMOTE После SMOTE
Какая модель нам подходит?
Примеры из реальной жизни Лизинг
До обработки данных После чистки и обогащения данных
Главное не переобучиться!
Вопросы? Наталья Полковникова Генеральный директор Институт прикладной математики и информатики
[email protected]
/ +7 495 185 58 64