Slide 1

Slide 1 text

LINE Data Dev x ITSeed Nina Cheng, Data Dev Team 2022.03.18

Slide 2

Slide 2 text

Nina Cheng LINE Taiwan Data Engineer #登⼭ #露營 #潛⽔ #貓 #ITSeed 14th

Slide 3

Slide 3 text

Questions Data dev 是如何使⽤機器學習⽅法或統計分析來優 化使⽤者體驗︖在 LINE 擔任資料分析師(員)相 關⼯作除了技術以外還需要哪些⽅⾯的能⼒︖ LINE 的使⽤者數量龐⼤,在後台上應該有⾮常 龐⼤的數據量,想問⼀下 LINE 通常都如何應⽤ 這些⼤量的數據呢︖ 想請問 Data dev 部⾨對於資料分析的開發策略是什麼︖ ⽬前是針對什麼項⽬進⾏主⼒分析︖ 如果想進⼊ LINE Taiwan ⼯作需要具備哪些特質或是能⼒︖ 是否與在台灣的組織⽬標有關係︖ 會給予想要進⼊ LINE Taiwan ⼯作的⼤學⽣, 什麼樣⼦的建議呢︖(⼼態、軟硬實⼒) 請問⼯作下來感受到 LINE Taiwan 的公司⽂化是什麼樣⼦︖

Slide 4

Slide 4 text

LINE Data Dev Me 智慧⼊⼝ 應⽤與產品 團隊⾓⾊與職能 ⼯作流程 資料⼯程師的⼀天 你問我答 LINE Family Services 巨量資料 LINE

Slide 5

Slide 5 text

資料科學家大解密 - LINE資料工程部門介紹 - 資料科學生活 - 職場眉眉角角 Closing the Distance

Slide 6

Slide 6 text

LINE Family Services Official Account Ads 圖⽚來源︓https://hub.line.me/

Slide 7

Slide 7 text

USERS > 19M/d LINE TODAY > 1M articles/y LINE SHOPPING > 10M queries/m OA > 1B interactions/m Data in LINE

Slide 8

Slide 8 text

AI-enhanced LINE Services Official Account Ads 圖⽚來源︓https://hub.line.me/ 如何推薦用戶會感興趣的商家? 如何確保新聞品質? 防止假新聞擴散 如何判斷潛在的訂閱制流失戶? 如何幫助用戶更快搜到想聽的歌? 如何讓用戶買更多? 如何投遞廣告?

Slide 9

Slide 9 text

LINE 資料⼯程團隊 - AI 應用與服務 - 團隊角色與職能 - 工作流程

Slide 10

Slide 10 text

AI-enabled Applications Business Intelligence Data Dev LINE Family Services LINE TODAY LINE SHOPPING LINE SPOT LINE MUSIC LINE STICKER LINE VOOM LINE Reward Official Account Fact Checker LINE HELP TW LINE TRAVEL Ads 獨立的資料⼯程部⾨,提供資料科學解決⽅案 LINE TODAY 甲方中的乙方:接收各服務需求、同時也打造自己的產品!

Slide 11

Slide 11 text

Data Dev LINE Family Services LINE SHOPPING LINE SPOT LINE MUSIC LINE STICKER LINE VOOM LINE Reward Fact Checker LINE HELP TW LINE TRAVEL NLP Knowledge Graph MarTech NER Classifier Duplication Detector Auto completion Keyword Extraction Related Search Text Generation User Tagging Data Analytics Recom- mendation RFM CLV 以NLP與MarTech應⽤實現服務優化 LINE TODAY Uplift Modeling 廣告/推薦/搜尋

Slide 12

Slide 12 text

12 具體是什麼意思呢?

Slide 13

Slide 13 text

NLP應⽤:LINE購物相關搜尋關鍵字推薦 根據輸入的關鍵字,推薦出更細的關鍵字, 幫助使⽤者快速找到想要購買的產品。 當使⽤者搜尋: “吸塵器” NLP

Slide 14

Slide 14 text

14 MarTech應⽤:顧客價值預測 從歷史用戶行為與交易資料,利用機器學習模型,協助服務找出最有價值的顧客! R F M MarTech

Slide 15

Slide 15 text

15 MarTech應⽤:顧客價值預測 從歷史用戶行為與交易資料,利用機器學習模型,協助服務找出最有價值的顧客! RFM Model CLV Model 歷史價值衡量 未來價值預測 MarTech

Slide 16

Slide 16 text

LINE 資料⼯程團隊 - AI 應用與服務 - 團隊角色與職能 - 工作流程

Slide 17

Slide 17 text

17 資料⼯程 Data Engineering 資料科學 Data Science 資料分析 Data Analytics 應⽤ ⼯程 資料搜集 資料倉儲 資料管線 機器學習 深度學習 模型開發與優化 數據運營 A/B Testing 商業洞⾒ 報表建置 資料科學⽔有多深?

Slide 18

Slide 18 text

Skills and Responsibility • Build and optimize da ta pipeline architectur e • Assemble large, com plex data sets that m eet requirements Data Engineer Data Analyst Big data infra, SQL, ET L, message queuing • Interpret data, analyz e results using statisti cal techniques • Identify, analyze, and interpret trends or pat terns in complex data sets Statistics, Data Visualiz ation, Business Knowle dge SKILL RESPONSIBILITY • Select appropriate da tasets and data repre sentation methods • Research and imple ment appropriate ML algorithms Data Scientist Machine learning, deep learning, CV, NLP, Spe ech ML Svc Engineer • Build and scale mach ine learning infrastruc ture • Monitor model perfor mance System infrastructure d esign, DevOps

Slide 19

Slide 19 text

Skills and Responsibility • Build and optimize da ta pipeline architectur e • Assemble large, com plex data sets that m eet requirements Data Engineer Data Analyst Big data infra, SQL, ET L, message queuing • Interpret data, analyz e results using statisti cal techniques • Identify, analyze, and interpret trends or pat terns in complex data sets Statistics, Data Visualiz ation, Business Knowle dge SKILL RESPONSIBILITY Pipeline Biz • Select appropriate da tasets and data repre sentation methods • Research and imple ment appropriate ML algorithms Data Scientist Machine learning, deep learning, CV, NLP, Spe ech Model ML Svc Engineer • Build and scale mach ine learning infrastruc ture • Monitor model perfor mance System infrastructure d esign, DevOps Service

Slide 20

Slide 20 text

LINE 資料⼯程團隊 - AI 應用與服務 - 團隊角色與職能 - 工作流程

Slide 21

Slide 21 text

ML Workflow DS DS DS DS EDA Model build Hyper-parameter tuning Evaluation Feature Engineering Analysis 已知問題 + 既有資料 Feature Model 在學校做 ML,你可能會經歷以下幾個工作階段:

Slide 22

Slide 22 text

DS DE MSE DA PM Biz DS DE DS DS DE DA MSE EDA Model build Hyper-parameter tuning Evaluation Feature Engineering Error analysis Scaling Performance Model decay Data drift Feature Model Data Label Reliability Biz analysis ML Workflow 進到職場後: ? Biz problem

Slide 23

Slide 23 text

從專案看資料科學

Slide 24

Slide 24 text

NLP應用專案 能不能用 AI 幫我優化搜尋頁的關鍵字推薦? 需求方 圖⽚來源: Google 以 LINE 購物相關搜尋為例

Slide 25

Slide 25 text

試著以分析師或顧問的角色,進行需求訪談 目前的狀況如何?為什麼想要優化?目標是什麼? Data dev 挖出其背後的痛點,拆解問題,才能針對問題,解決問題

Slide 26

Slide 26 text

NLP應用專案 我們發現,目前單純就字詞相似度做推薦, 導致常常推薦冷門產品,而非當下流行熱銷的產品。 圖⽚來源: Google 以 LINE 購物相關搜尋為例 我想要幫助用戶快速找到他想要的產品,縮短下單時間。 我想要在用戶結完帳後,推薦他相關的產品,誘使他買更多。 需求方

Slide 27

Slide 27 text

試著以分析師或顧問的角色,進行需求訪談 評估結果的指標? Data dev 圖⽚來源: Google 需求方 提高關鍵字點擊率、導購率、縮短下單時間。

Slide 28

Slide 28 text

NLP應用專案 以 LINE 購物相關搜尋為例 e.g. 吹風機、掃地機器人 當使⽤者搜尋: “吸塵器” 根據輸入的關鍵字,推薦出產品規格、品牌等更細 的關鍵字,幫助使⽤者快速找到想要購買的產品。 在搜尋⾴: 根據輸入的關鍵字,推薦出相似的產品, 誘使使⽤者買更多。 在導購⾴: 使⽤LINE購物N天內全站搜尋紀錄, 以確保字詞與商品熱度。 訓練資料:

Slide 29

Slide 29 text

DS DE MSE DA PM Biz DS DE DS DS DE DA MSE EDA Model build Hyper-parameter tuning Evaluation Feature Engineering Error analysis Scaling Performance Model decay Data drift Feature Model Data Label Reliability Biz analysis ? Biz problem NLP應用專案 以 LINE 購物相關搜尋為例 • 資料研究與選擇 • 資料量與效能 • 資料處理 Data Label

Slide 30

Slide 30 text

DS DE MSE DA PM Biz DS DE DS DS DE DA MSE • 線下與線上測試 • 不只看 [統計指標] 更要看 [商業指標] ? EDA Model build Hyper-parameter tuning Evaluation Feature Engineering Error analysis Scaling Performance Model decay Data drift Feature Model Data Label Reliability Biz analysis NLP應用專案 以 LINE 購物相關搜尋為例 Biz problem

Slide 31

Slide 31 text

DS DE MSE DA PM Biz DS DE DS DS DE DA MSE Scaling Performance • 批量預測或即時預測 • 更新頻率 ? EDA Model build Hyper-parameter tuning Evaluation Feature Engineering Error analysis Model decay Data drift Feature Model Data Label Reliability Biz analysis NLP應用專案 以 LINE 購物相關搜尋為例 Biz problem

Slide 32

Slide 32 text

DS DE MSE DA PM Biz DS DE DS DS DE DA MSE ? EDA Model build Hyper-parameter tuning Evaluation Feature Engineering Error analysis Scaling Performance Model decay Data drift Feature Model Data Label Reliability Biz analysis NLP應用專案 以 LINE 購物相關搜尋為例 • 商業指標: CTR/CVR • 服務健康指標: SLO Biz problem

Slide 33

Slide 33 text

DS DE MSE DA PM Biz DS DE DS DS DE DA MSE ? Biz problem Key metrics How to use 優化關鍵字推薦 Model: Hit rate Model API NLP模型設計 EDA Model build Hyper-parameter tuning Evaluation Feature Engineering Error analysis Scaling Performance Model decay Data drift Feature Model Data Label Reliability Biz analysis NLP應用專案 以 LINE 購物相關搜尋為例 LINE購物 歷史搜尋紀錄 Biz: CTR/CVR/Steps Key metrics

Slide 34

Slide 34 text

資料工程師的一天

Slide 35

Slide 35 text

Question 你們覺得資料工程師的工作內容有哪些?

Slide 36

Slide 36 text

12 11 10 9 資料工程師的工作組成 0% 5% 10% 15% 20% 25% 30% 講座分享 報表建置 資料分析 Data Pipeline & ETL 服務維運 MLOps 打造產品 Time • Model API 開發 • 產品 Backend 開發

Slide 37

Slide 37 text

12 11 10 9 資料工程師的工作組成 0% 5% 10% 15% 20% 25% 30% 講座分享 報表建置 資料分析 Data Pipeline & ETL 服務維運 MLOps 打造產品 Time

Slide 38

Slide 38 text

12 11 10 9 資料工程師的工作組成 0% 5% 10% 15% 20% 25% 30% 講座分享 報表建置 資料分析 Data Pipeline & ETL 服務維運 MLOps 打造產品 Time

Slide 39

Slide 39 text

12 11 10 9 資料工程師的工作組成 0% 5% 10% 15% 20% 25% 30% 講座分享 報表建置 資料分析 Data Pipeline & ETL 服務維運 MLOps 打造產品 Time • 資料流建置 • ETL自動化

Slide 40

Slide 40 text

12 11 10 9 資料工程師的工作組成 0% 5% 10% 15% 20% 25% 30% 講座分享 報表建置 資料分析 Data Pipeline & ETL 服務維運 MLOps 打造產品 Time • 廣告成效分析 • 免費貼圖用戶輪廓分析

Slide 41

Slide 41 text

12 11 10 9 資料工程師的工作組成 0% 5% 10% 15% 20% 25% 30% 講座分享 報表建置 資料分析 Data Pipeline & ETL 服務維運 MLOps 打造產品 Time

Slide 42

Slide 42 text

12 11 10 9 資料工程師的工作組成 0% 5% 10% 15% 20% 25% 30% 講座分享 報表建置 資料分析 Data Pipeline & ETL 服務維運 MLOps 打造產品 Time • 工程團隊內部分享 • 與業務團隊分享 • 對外分享

Slide 43

Slide 43 text

你問我答 - 事前預習問題 - 現場QA

Slide 44

Slide 44 text

Q: 加⼊ LINE 之後有遇過什麼關於⼯作⽅⾯印象深刻的事情︖ ⽽過程⼜是什麼︖ 圖⽚來源︓梗圖產⽣器

Slide 45

Slide 45 text

Q: 請問⼯作下來感受到 LINE Taiwan 的公司⽂化是什麼樣⼦︖ Users Rule Always Data-driven Go Brave. No Fear. No Regrets 以使用者需求為依歸 憑藉事實、而非直覺 勇敢地挑戰、不要害怕失敗

Slide 46

Slide 46 text

Q: 想詢問覺得在 LINE Taiwan 任職與服務,和其他公司最不同且 最吸引⼈的是什麼︖ • 巨量資料 • ⼤的舞台 • 好的⼯作氣氛

Slide 47

Slide 47 text

Q: 如果想進⼊ LINE Taiwan ⼯作需要具備哪些 特質或是能⼒︖是否與在台灣的組織⽬標有關係︖ Q: 會給予想要進⼊ LINE Taiwan ⼯作的⼤學⽣, 什麼樣⼦的建議呢︖(⼼態、軟硬實⼒) Q: 請問您剛進⼊ LINE 時,是否有遇到不適應的 狀況︖如果有的話是如何調適的呢︖

Slide 48

Slide 48 text

Q&A

Slide 49

Slide 49 text

THANK YOU