Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Что делать, если данных мало?
Search
Big Data & AI Conference 2020
September 17, 2020
Business
0
72
Что делать, если данных мало?
Наталья Полковникова, генеральный директор, ООО "Институт прикладной математики и информатики"
Big Data & AI Conference 2020
September 17, 2020
Tweet
Share
More Decks by Big Data & AI Conference 2020
See All by Big Data & AI Conference 2020
Как искусственный интеллект помогает снизить вредные выбросы в атмосферу на металлургическом производстве.
aiconforg
0
99
Как сломать рекламную индустрию: повышаем эффективность рекламы с помощью Emotion Recognition
aiconforg
0
62
Цифровой помощник для маневрового диспетчера
aiconforg
0
290
Прогресс ученика: Как анализ больших данных помогает быстрее и дешевле достичь образовательных целей
aiconforg
0
120
Рекомендательная система для увеличения кросс-продаж: опыт инвестиционной компании
aiconforg
0
37
Дополненная аналитика: практический подход к автоматизации внутренней аналитики
aiconforg
1
54
Построение системы realtime-аналитики на ClickHouse
aiconforg
0
170
Как оценить эмоциональную реакцию на рекламу дистанционно, быстро и точно.
aiconforg
0
77
Учет новых слов в языковых моделях классификации
aiconforg
0
47
Other Decks in Business
See All in Business
株式会社スマートラウンド 会社紹介資料 / CompanyDeck
smartround
0
1.4k
Spice Factory Inc. Culture Deck
spicefactory
0
17k
Fuji Oil 2025 Board of Directors
tsogo817421
2
360
生成AI専任営業が語るre:Inventで発表された生成AIアップデート情報
suzakiyoshito
0
250
Connected Robotics
cr
1
55k
イークラウド会社紹介 ~挑戦で、つながる社会へ~
ecrowd
1
4.3k
アシスト 会社紹介資料
ashisuto_career
3
150k
(15枚)マイクロマネジメントとは何か? 問題点は? 正しいマネジメントとは何かを考える(AI活用スライド)
nyattx
PRO
2
2.4k
【素人向け生成AI入門】保健師のチカラにAIをプラス!
minamototeruya
0
200
Growth Book
kuradashi
0
200
LATEGRA Recruitment Deck_2025
lategra
0
7.5k
組織でAIをQAに活用する仕組みづくり / Scaling AI-Powered QA Across Your Organization
medley
0
1k
Featured
See All Featured
Building AI with AI
inesmontani
PRO
1
610
Mind Mapping
helmedeiros
PRO
0
45
GraphQLの誤解/rethinking-graphql
sonatard
74
11k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
81
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
330
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
170
Making Projects Easy
brettharned
120
6.5k
Design in an AI World
tapps
0
110
How to Ace a Technical Interview
jacobian
281
24k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
180
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
Designing for humans not robots
tammielis
254
26k
Transcript
Что делать если данных мало? Наталья Полковникова Институт прикладной математики
и информатики
[email protected]
+7 495 185 58 64
Типичные проблемы цифровой трансформации реального бизнеса ЧТО ДЕЛАТЬ? Данных мало
Типичный пример – лизинговая компания с относительно не большим количеством клиентов Данные есть, но в них мало интересующих нас событий Типичный пример данные по увольнениям х х х х х х х х х х х х х х х х х ✓
Внешние источники • Социальные сети • Спакр • Данные агентства
кредитных историй …….
Проблемы
Что делать если данные все равно не сбалансированы? Oversampling Undersampling
Примеры из реальной жизни Увольнения сотрудников
Данные по клиентам/сотрудникам До SMOTE После SMOTE Имеют некоторое распределение
Целевой показатель
Статистика хорошая. Но что получили? Но мы же хотели поймать
красных! Статистика, описывающая работу моделей в среднем по 2 классам
До SMOTE После SMOTE
Какая модель нам подходит?
Примеры из реальной жизни Лизинг
До обработки данных После чистки и обогащения данных
Главное не переобучиться!
Вопросы? Наталья Полковникова Генеральный директор Институт прикладной математики и информатики
[email protected]
/ +7 495 185 58 64