Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
資料煉金術師:一場關於 LINE 電商煉金的故事
Search
LINE Developers Taiwan
PRO
January 30, 2024
Technology
1
6.1k
資料煉金術師:一場關於 LINE 電商煉金的故事
Speaker: Vila Lin
Event: 梅竹黑客松企業參訪
LINE Developers Taiwan
PRO
January 30, 2024
Tweet
Share
More Decks by LINE Developers Taiwan
See All by LINE Developers Taiwan
從校園到職場 我的實習旅程
line_developers_tw
PRO
0
90
探索數據未來
line_developers_tw
PRO
0
10
MLE 的修煉之路
line_developers_tw
PRO
0
81
LINE 實習分享 & 國際黑客松參賽分享
line_developers_tw
PRO
0
41
在 GCP 運用 Parse 全家餐管理那堆 AI 應用的資料
line_developers_tw
PRO
0
37
40歲的我會給20歲的自己,關於軟體開發的7個建議
line_developers_tw
PRO
0
9.3k
從零到一:轉碼仔的實習攻略
line_developers_tw
PRO
0
64
如何在團隊發揮數據影響力: 以電商資料科學家為例
line_developers_tw
PRO
1
61
做Data超讚的 誰懂?
line_developers_tw
PRO
0
48
Other Decks in Technology
See All in Technology
All You Need Is Kusa 〜Slackデータで始めるデータドリブン〜
jonnojun
0
150
AIで進化するソフトウェアテスト:mablの最新生成AI機能でQAを加速!
mfunaki
0
130
Classmethod AI Talks(CATs) #20 司会進行スライド(2025.04.10) / classmethod-ai-talks-aka-cats_moderator-slides_vol20_2025-04-10
shinyaa31
0
150
LangfuseでAIエージェントの 可観測性を高めよう!/Enhancing AI Agent Observability with Langfuse!
jnymyk
1
210
Automatically generating types by running tests
sinsoku
2
1.3k
いつも初心者向けの記事に助けられているので得意分野では初心者向けの記事を書きます
toru_kubota
2
300
Lightdashの利活用状況 ー導入から2年経った現在地_20250409
hirokiigeta
2
280
От ручной разметки к LLM: как мы создавали облако тегов в Lamoda. Анастасия Ангелова, Data Scientist, Lamoda Tech
lamodatech
0
670
古き良き Laravel のシステムは関数型スタイルでリファクタできるのか
leveragestech
1
660
PicoRabbit: a Tiny Presentation Device Powered by Ruby
harukasan
PRO
2
150
50人の組織でAIエージェントを使う文化を作るためには / How to Create a Culture of Using AI Agents in a 50-Person Organization
yuitosato
6
3.4k
AWSのマルチアカウント管理 ベストプラクティス最新版 2025 / Multi-Account management on AWS best practice 2025
ohmura
4
260
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
336
57k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.2k
Testing 201, or: Great Expectations
jmmastey
42
7.4k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
12k
Embracing the Ebb and Flow
colly
85
4.6k
Rails Girls Zürich Keynote
gr2m
94
13k
The Cost Of JavaScript in 2023
addyosmani
49
7.7k
Into the Great Unknown - MozCon
thekraken
37
1.7k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
178
53k
The Pragmatic Product Professional
lauravandoore
33
6.5k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
52
2.4k
Rebuilding a faster, lazier Slack
samanthasiow
80
8.9k
Transcript
資料煉⾦術師
01 02 02 推薦系統 資料科學家、機器學習工程師、資料工程師 電商鍊成陣 國家鍊⾦術師 真的有賢者之石嗎? 我所看到的真理 Agenda
Vila Lin 電商資料⼯程經理 • 學歷: 清⼤⽣資 MS • 領域: 機器學習、類神經網路、⽣物統計
、演算法設計與分析
SECTION 01 電商鍊成陣 推薦系統
推薦 in LINE 錢包 左: LINE 禮物個⼈化品牌推薦 右: LINE 個⼈化類別推薦
推薦 in LINE 購物 個⼈化品牌商品 個⼈化店家 熱銷⾦榜 低價商品 今⽇熱搜字
SECTION 02 資料⼯程師、機器學習⼯程師、資料科學家 國家鍊⾦術師
電商鍊⾦術師 資料 分析師 軟體 ⼯程師 DevOps ⼯程師 商業面向 工程面向
電商鍊⾦術師 資料科學家 機器學習工程師 資料工程師 研究 ML/AI 進階分析 研究 ML/AI 進階分析
模型/演算法/參數最佳化 開發 ML 流程 軟體工程 設計模式 分散式架構
鍊⾦術師的戰⾾位置 資料科學家 資料工程師 機器學習工程師 ML Ops 陣線 資料分析 & 挑選
資料收集 & 清洗 建模 驗證 推論 部署
鍊⾦術師的技能 資料庫 資料工具與平台 天橋下的說書人 資料視覺化 商業洞察 成效指標 假設與實驗 模型推論 統計與
ML 建模 模型佈建 資料流 ML Ops
資料⼯程師 資料流 資料庫 資料⼯具與平台 ML Ops 資料⼯程師的主線技能
資料科學家 統計與 ML 建模 推論 假設與實驗 成效評估 資料科學家的主線技能 A/B Testing
Hit Rate F1 Score CTR
關於模型
關於模型 雙塔模型 (推薦系統) BERT (NLP) CNN (影像/語音辨識)
機器學習⼯程師 ML Ops 模型佈建 統計與 ML 建模 模型推論 機器學習⼯程師的主線技能
SECTION 03 真的有賢者之⽯嗎? 我所看到的真理
沒有賢者之⽯ 任何演算法/模型都有適⽤場景 (LLM 的 fine-tune其實也是滿滿領域知識) 遇到困難⼤家持續溝通和討論 找出 dev 與 po
都可以接受的⽅案
不要被數字騙了 模型成效過好其實很可疑 記得回過頭確認資料集是否有問題 免得上線引入真實資料的模型⼤失所望
數學很重要 • 資料⼯程師: 資料確保 (判讀統計趨勢找問題) • 資料科學家: 統計分析、模型驗證、 A/B 測試
• 機器學習⼯程師: 特徵⼯程、實作演算法或模型
None
None
None