Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
跨領域資料工作之路
Search
Erica Li
October 20, 2016
Technology
0
190
跨領域資料工作之路
Erica Li
October 20, 2016
Tweet
Share
More Decks by Erica Li
See All by Erica Li
跨領域Data工作之路 淡江
wlsherica
1
110
Spark streaming HadoopCon 2016
wlsherica
0
350
SparkSQL HadoopCon 2016
wlsherica
0
540
Hadoop vs. Spark Today
wlsherica
0
170
Spark Introduction 20160426 NTU
wlsherica
1
790
Spark Introduction 2015
wlsherica
1
210
Hadoop HDFS & AWS
wlsherica
1
240
Hackathon of Pixnet.net 2015
wlsherica
0
85
Spark SQL of Hadoop Con 2015
wlsherica
1
520
Other Decks in Technology
See All in Technology
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
2
230
プロファイルとAIエージェントによる効率的なデバッグ / Effective debugging with profiler and AI assistant
ymotongpoo
1
760
[re:Inent2025事前勉強会(有志で開催)] re:Inventで見つけた人生をちょっと変えるコツ
sh_fk2
1
1.2k
Boxを“使われる場”にする統制と自動化の仕組み
demaecan
0
140
東京大学「Agile-X」のFPGA AIデザインハッカソンを制したソニーのAI最適化
sony
0
190
Data Engineering Guide 2025 #data_summit_findy by @Kazaneya_PR / 20251106
kazaneya
PRO
4
630
re:Inventに行くまでにやっておきたいこと
nagisa53
0
970
進化する大規模言語モデル評価: Swallowプロジェクトにおける実践と知見
chokkan
PRO
3
440
猫でもわかるAmazon Q Developer CLI 解体新書
kentapapa
1
290
ゼロコード計装導入後のカスタム計装でさらに可観測性を高めよう
sansantech
PRO
1
660
Okta Identity Governanceで実現する最小権限の原則
demaecan
0
240
GTC 2025 : 가속되고 있는 미래
inureyes
PRO
0
150
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
514
110k
Designing for humans not robots
tammielis
254
26k
Code Review Best Practice
trishagee
72
19k
Typedesign – Prime Four
hannesfritz
42
2.8k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Building an army of robots
kneath
306
46k
Why Our Code Smells
bkeepers
PRO
340
57k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
34
2.3k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
10
900
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Writing Fast Ruby
sferik
630
62k
GraphQLとの向き合い方2022年版
quramy
49
14k
Transcript
跨領域-資料工作之路 2016-10-19 1
關於我 Erica Li • ericalitw • Inbound.tw CTO & Co-Founder
• ElasticMining Co-Founder • Taiwan Spark User Group Founder 2 開放資料技術讀書會、參 加比賽、與其他社群合辦 活動、翻譯技術文件等 將心理健康帶進數 位層次,補實體與虛 擬間的落差
關於你 • 商學院請舉手 • 理學院請舉手 • 聽過Big Data、巨量資料等用語請舉手 • 計畫朝巨量資料產業發展的請舉手
• 剛吃飽的請舉手 3
大綱 • 學界到業界 • 統計人、資料工程師、資料科學家 • 進入資料相關職缺的捷徑 • 求職之路停看聽 4
學界到業界 5
SAS, R, SPSS SAS, Java, Python Python Python, SAS... 6
Mix-Based Recommendation
Content-Based Recommendation
None
None
Data Analyst BI Marketing Web Team EC Team BI&DBA
12
13 http://blog.ekipa.co/managed-remote-teams/
14 https://selftaughtcoders.com/from-idea-to-launch/lesson-12/hi gh-level-design-web-application-controllers-views/
巨量資料 15
http://www.inside.com.tw/2015/02/06/big-data-1-origin-and-4vs
Data Pipeline • 資料從何而來 • 資料如何進來 • 資料如何儲存 • 資料如何取用
• 資料如何計算 • ... 17
None
None
統計人、資料工程師、資料科學家 20
統計人 資料科學家 資料工程師 21
22 統計人 資料科學家 資料工程師 - 根據商業需求規劃分析流程 - 善用資料採礦技巧與理論 - 現存架構下進行結果整合
- 調教採礦分析系統效能與速 度再優化 - 應用統計理論與方法解決問 題 - 收集資料與實驗設計 - 分析、闡釋、掌握資料分析 - 針對分析結果作推論 - 建構、安裝、測試、維護資料 管理系統 - 優化資料底層程序與準則 - 整合新舊資料系統 - 客製化軟件功能 (UDF等) 產業知識、寫程式、數學理論、 資料視覺化、機器學習等 透過資料說話、數學、研究思 考、寫作、模型辯證等 資料庫設計、產品線上化、資料 收集、資料倉儲、資料編譯、與 資料共處等
23 Statistics Machine Learning Data Mining - 精準預測 - 強調software
systems - 專注於computer program - 強調統計推論 (點估計、信 賴區間、假設檢定等 ) - 資料暗藏的趨勢 - 資料鍊金術 Almost exactly the same. Learn from data! How? When? Why?
進入資料相關職缺的捷徑 24
線上學習平台 • edX | Free online courses from the world's
best universities • Coursera:一流大學免費在線課程平台| Coursera • Udacity a for-profit educational organization
None
打怪練等 • Kaggle: Your Home for Data Science • KDD
Cup • HACKATHON Taiwan • PIXNET HACKATHON • Facebook HACKATHON • ... 27
求職之路停看聽 28
畢業。下一步 • 國內深造、出國唸書 • 打工度假、周遊列國 • 在家冥想 • ... •
解決問題?優先面對自己的問題 29
面試? • 履歷準備、中英簡摘 • 經營自己的Linkedin等其他求職窗口 • 善用人脈與學校資源 • 練習、平常心、深呼吸 30
https://goo.gl/zLNn7s
其他問題 31