Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Что делать, если данных мало?
Search
Big Data & AI Conference 2020
September 17, 2020
Business
0
72
Что делать, если данных мало?
Наталья Полковникова, генеральный директор, ООО "Институт прикладной математики и информатики"
Big Data & AI Conference 2020
September 17, 2020
Tweet
Share
More Decks by Big Data & AI Conference 2020
See All by Big Data & AI Conference 2020
Как искусственный интеллект помогает снизить вредные выбросы в атмосферу на металлургическом производстве.
aiconforg
0
99
Как сломать рекламную индустрию: повышаем эффективность рекламы с помощью Emotion Recognition
aiconforg
0
62
Цифровой помощник для маневрового диспетчера
aiconforg
0
290
Прогресс ученика: Как анализ больших данных помогает быстрее и дешевле достичь образовательных целей
aiconforg
0
120
Рекомендательная система для увеличения кросс-продаж: опыт инвестиционной компании
aiconforg
0
37
Дополненная аналитика: практический подход к автоматизации внутренней аналитики
aiconforg
1
54
Построение системы realtime-аналитики на ClickHouse
aiconforg
0
170
Как оценить эмоциональную реакцию на рекламу дистанционно, быстро и точно.
aiconforg
0
77
Учет новых слов в языковых моделях классификации
aiconforg
0
47
Other Decks in Business
See All in Business
ミツモアAI推進G AI活用Tips50
mmota
0
360
【新卒向け】株式会社リブに興味のある方へ
libinc
0
9.8k
インキュデータ会社紹介資料
okitsu
3
48k
【ニトエル株式会社】会社紹介資料
hr_nitoel
0
180
Где вы ошибётесь и что с этим сделать
alexanderbyndyu
0
410
【新卒採用資料】Natee Company Deck _202512
nateehr
0
1.5k
jinjer recruiting pitch
jinjer_official
0
120k
【Progmat】ST-Market-Outlook-2026
progmat
0
480
なぜ、あのPdMは「時間がない」と言わないのか? ~元エンジニアPdMが実践する「ドキュメント化 x MCP」の全貌~
sam8helloworld
0
140
VISASQ: ABOUT DEV TEAM
eikohashiba
6
40k
株式会社アペルザ_中途採用向け会社紹介資料
hr_team_aperza
4
140k
(8枚)営業プロセス、パイプライン、予材管理、カスタマージャーニーの基本
nyattx
PRO
0
150
Featured
See All Featured
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
How STYLIGHT went responsive
nonsquared
100
6k
30 Presentation Tips
portentint
PRO
1
180
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
78
Designing Experiences People Love
moore
143
24k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.1k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
Designing Powerful Visuals for Engaging Learning
tmiket
0
200
The agentic SEO stack - context over prompts
schlessera
0
580
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.4k
Transcript
Что делать если данных мало? Наталья Полковникова Институт прикладной математики
и информатики
[email protected]
+7 495 185 58 64
Типичные проблемы цифровой трансформации реального бизнеса ЧТО ДЕЛАТЬ? Данных мало
Типичный пример – лизинговая компания с относительно не большим количеством клиентов Данные есть, но в них мало интересующих нас событий Типичный пример данные по увольнениям х х х х х х х х х х х х х х х х х ✓
Внешние источники • Социальные сети • Спакр • Данные агентства
кредитных историй …….
Проблемы
Что делать если данные все равно не сбалансированы? Oversampling Undersampling
Примеры из реальной жизни Увольнения сотрудников
Данные по клиентам/сотрудникам До SMOTE После SMOTE Имеют некоторое распределение
Целевой показатель
Статистика хорошая. Но что получили? Но мы же хотели поймать
красных! Статистика, описывающая работу моделей в среднем по 2 классам
До SMOTE После SMOTE
Какая модель нам подходит?
Примеры из реальной жизни Лизинг
До обработки данных После чистки и обогащения данных
Главное не переобучиться!
Вопросы? Наталья Полковникова Генеральный директор Институт прикладной математики и информатики
[email protected]
/ +7 495 185 58 64