Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Physicists in Data Science (talk in Hungarian l...
Search
szilard
October 09, 2018
0
68
Physicists in Data Science (talk in Hungarian language) - AtomCsill (from the atoms to the stars) lecture series for high-school students - Eotvos University, Budapest, Oct 2018
szilard
October 09, 2018
Tweet
Share
More Decks by szilard
See All by szilard
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Data Con LA - Oct 2020
szilard
0
140
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - Albuquerque Machine Learning Meetup (Online) - Aug 2020
szilard
0
94
Better than Deep Learning: Gradient Boosting Machines (GBM) - eRum conference - invited talk - June 2020
szilard
0
92
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - LA Data Science Meetup - February 2020
szilard
0
83
A Random Walk in Data Science and Machine Learning in Practice - CEU, Business Analytics Masters - Budapest, Febr 2020
szilard
0
290
Better than My Meetup/Conference Talks: Going Deeper in Various GBM Topics - GBM Advanced Workshop - Budapest, Nov 2019
szilard
0
54
Gradient Boosting Machines (GBM): From Zero to Hero (with R and Python Code) - Budapest BI Forum, Budapest, Nov 2019
szilard
0
130
Make Machine Learning Boring Again: Best Practices for Using Machine Learning in Businesses - LA Data Science Meetup - Playa Vista, August 2019
szilard
0
100
Better than Deep Learning: Gradient Boosting Machines (GBM) / 2019 edition - Budapest R and Data Science Meetups - Budapest, June 2019
szilard
0
79
Featured
See All Featured
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
44
2.2k
jQuery: Nuts, Bolts and Bling
dougneiner
61
7.5k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
250
21k
Writing Fast Ruby
sferik
627
61k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
28
2k
Into the Great Unknown - MozCon
thekraken
32
1.5k
Designing Experiences People Love
moore
138
23k
Scaling GitHub
holman
458
140k
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Navigating Team Friction
lara
183
14k
A Philosophy of Restraint
colly
203
16k
Automating Front-end Workflow
addyosmani
1366
200k
Transcript
Fizikusok az adattudományban Pafka Szilárd Epoch (USA) AtomCsill, ELTE TTK
Budapest, 2018. október
Adattudomány / adatbányászat data science / data mining
Adattudomány / adatbányászat data science / data mining adatok érték
Adattudomány / adatbányászat data science / data mining adatok érték
adatok: számítógépes rendszerekben érték: tudás, vmi hasznos, vállalatnál $$$
None
None
None
None
None
None
None
y = f (x1, x2, ... , xn)
y = f (x1, x2, ... , xn)
Adattudomány?
Adattudomány?
Adattudomány?
Adattudomány?
None
None
None
None
None
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
- adatok beolvasása - adatok manipulációja - adatvizualizáció (ábrák) -
statisztikai modellezés - modellek felhasználása
None
None
None
None
None
None
None
Adatbányászat?
None
- valószínűségi eloszlások - valószínűségi összefüggések - valószínűségszámítás - statisztika
...
None
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
Source: Hastie etal, ESL 2ed
None
None
None
None
None
None
None
None
None
None
None
https://www.stitchdata.com/resources/reports/the-state-of-data-science/ (2015)
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD
1992- ELTE fizikus 1996-98 Monte Carlo szim., Kosterlitz-Thouless 1999- pénzügyi
alkalmazások 2001-05 CIB Bank kockázatkezelés 2004 PhD 2006- Kalifornia, data science 2016-17 CEU, UCLA (1-1 kurzus)
numerikus jártasság adatok manipulációja, “tisztítása” adatvizualizáció eszközök erre (Unix/Linux, Matlab,
R, Python) programozás szimulációk modellekben való gondolkodás
None
Soft skills: - curiosity - creativity - skepticism - ask
good questions - communication
By 2018, the US alone could face a shortage of
140,000 to 190,000 people with deep analytical skills - McKinsey, 2011
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
Összefoglaló: 1. Adattudomány: példák, 1 projekt röviden (eszközök, szükséges tudás)
2. Miért fizikusok? 3. Pár karriertanács