Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
跨領域資料工作之路
Search
Erica Li
October 20, 2016
Technology
0
190
跨領域資料工作之路
Erica Li
October 20, 2016
Tweet
Share
More Decks by Erica Li
See All by Erica Li
跨領域Data工作之路 淡江
wlsherica
1
110
Spark streaming HadoopCon 2016
wlsherica
0
350
SparkSQL HadoopCon 2016
wlsherica
0
540
Hadoop vs. Spark Today
wlsherica
0
170
Spark Introduction 20160426 NTU
wlsherica
1
790
Spark Introduction 2015
wlsherica
1
210
Hadoop HDFS & AWS
wlsherica
1
240
Hackathon of Pixnet.net 2015
wlsherica
0
84
Spark SQL of Hadoop Con 2015
wlsherica
1
520
Other Decks in Technology
See All in Technology
下手な強制、ダメ!絶対! 「ガードレール」を「檻」にさせない"ガバナンス"の取り方とは?
tsukaman
2
460
slog.Handlerのよくある実装ミス
sakiengineer
4
480
Oracle Cloud Infrastructure IaaS 新機能アップデート 2025/06 - 2025/08
oracle4engineer
PRO
0
120
新アイテムをどう使っていくか?みんなであーだこーだ言ってみよう / 20250911-rpi-jam-tokyo
akkiesoft
0
360
Modern Linux
oracle4engineer
PRO
0
160
企業の生成AIガバナンスにおけるエージェントとセキュリティ
lycorptech_jp
PRO
3
200
【NoMapsTECH 2025】AI Edge Computing Workshop
akit37
0
230
2つのフロントエンドと状態管理
mixi_engineers
PRO
3
170
Unlocking the Power of AI Agents with LINE Bot MCP Server
linedevth
0
120
Snowflake×dbtを用いたテレシーのデータ基盤のこれまでとこれから
sagara
0
130
AIの最新技術&テーマをつまんで紹介&フリートークするシリーズ:はじめてのローカルLLM
stanaka26
0
100
roppongirb_20250911
igaiga
1
260
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
How GitHub (no longer) Works
holman
315
140k
Building Adaptive Systems
keathley
43
2.7k
Typedesign – Prime Four
hannesfritz
42
2.8k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.7k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
The Cult of Friendly URLs
andyhume
79
6.6k
The Straight Up "How To Draw Better" Workshop
denniskardys
236
140k
How to Ace a Technical Interview
jacobian
279
23k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
930
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.4k
Transcript
跨領域-資料工作之路 2016-10-19 1
關於我 Erica Li • ericalitw • Inbound.tw CTO & Co-Founder
• ElasticMining Co-Founder • Taiwan Spark User Group Founder 2 開放資料技術讀書會、參 加比賽、與其他社群合辦 活動、翻譯技術文件等 將心理健康帶進數 位層次,補實體與虛 擬間的落差
關於你 • 商學院請舉手 • 理學院請舉手 • 聽過Big Data、巨量資料等用語請舉手 • 計畫朝巨量資料產業發展的請舉手
• 剛吃飽的請舉手 3
大綱 • 學界到業界 • 統計人、資料工程師、資料科學家 • 進入資料相關職缺的捷徑 • 求職之路停看聽 4
學界到業界 5
SAS, R, SPSS SAS, Java, Python Python Python, SAS... 6
Mix-Based Recommendation
Content-Based Recommendation
None
None
Data Analyst BI Marketing Web Team EC Team BI&DBA
12
13 http://blog.ekipa.co/managed-remote-teams/
14 https://selftaughtcoders.com/from-idea-to-launch/lesson-12/hi gh-level-design-web-application-controllers-views/
巨量資料 15
http://www.inside.com.tw/2015/02/06/big-data-1-origin-and-4vs
Data Pipeline • 資料從何而來 • 資料如何進來 • 資料如何儲存 • 資料如何取用
• 資料如何計算 • ... 17
None
None
統計人、資料工程師、資料科學家 20
統計人 資料科學家 資料工程師 21
22 統計人 資料科學家 資料工程師 - 根據商業需求規劃分析流程 - 善用資料採礦技巧與理論 - 現存架構下進行結果整合
- 調教採礦分析系統效能與速 度再優化 - 應用統計理論與方法解決問 題 - 收集資料與實驗設計 - 分析、闡釋、掌握資料分析 - 針對分析結果作推論 - 建構、安裝、測試、維護資料 管理系統 - 優化資料底層程序與準則 - 整合新舊資料系統 - 客製化軟件功能 (UDF等) 產業知識、寫程式、數學理論、 資料視覺化、機器學習等 透過資料說話、數學、研究思 考、寫作、模型辯證等 資料庫設計、產品線上化、資料 收集、資料倉儲、資料編譯、與 資料共處等
23 Statistics Machine Learning Data Mining - 精準預測 - 強調software
systems - 專注於computer program - 強調統計推論 (點估計、信 賴區間、假設檢定等 ) - 資料暗藏的趨勢 - 資料鍊金術 Almost exactly the same. Learn from data! How? When? Why?
進入資料相關職缺的捷徑 24
線上學習平台 • edX | Free online courses from the world's
best universities • Coursera:一流大學免費在線課程平台| Coursera • Udacity a for-profit educational organization
None
打怪練等 • Kaggle: Your Home for Data Science • KDD
Cup • HACKATHON Taiwan • PIXNET HACKATHON • Facebook HACKATHON • ... 27
求職之路停看聽 28
畢業。下一步 • 國內深造、出國唸書 • 打工度假、周遊列國 • 在家冥想 • ... •
解決問題?優先面對自己的問題 29
面試? • 履歷準備、中英簡摘 • 經營自己的Linkedin等其他求職窗口 • 善用人脈與學校資源 • 練習、平常心、深呼吸 30
https://goo.gl/zLNn7s
其他問題 31