Slide 1

Slide 1 text

No content

Slide 2

Slide 2 text

Data Team實習分享 My Journey @ LINE Steven Lu / Data Dev Intern

Slide 3

Slide 3 text

01 02 03 About me 自介一下 Data Dev Intro 介紹我認識的Data Team Intern in Data Dev 實習生活長什麼樣子 CONTENT 04 What I learn 我學到的事

Slide 4

Slide 4 text

關於我 01 About me

Slide 5

Slide 5 text

Steven Lu LINE TECH FRESH Education 台師數學->台大資工網媒所 @CMLab Experience TECH FRESH @LINE Taiwan Limited (Now) Software Engineer Intern @Cathay Unitied Bank Software Engineer @MygramAI Lecturer @NTU CSIE 資訊系統訓練班 Data Dev

Slide 6

Slide 6 text

我所認識的Data Team 02 Data Dev Intro

Slide 7

Slide 7 text

Data Dev任務類型 Data Dev LINE Family Services LINE LINE SPOT LINE MUSIC LINE Sticker LINE VOOM LINE Reward Fact Checker LINE HELP TW LINE Trave l NLP CV MarTec h NER Classifier Duplication Detector Auto completion Keyword Extraction Related Search Text Generation User Tagging Data Analytics Recom- mendation CLV / RFM SHOPPING LINE TODA Y Image Search Social Intelligen ce Uplift Modeling Sales forecasting STT

Slide 8

Slide 8 text

Data Engineer Workflow DS DE DA PM Biz DE DS DE MLE Data preparation Scaling Performance Model decay Data drift EDA Model build Hyper-parameter t uning Evaluation Feature Engineerin g Error analysis DS MLE MLE DS MLE MLE DA DE 資料探索與準備 開發/訓練/測試 包裝/部署/監控

Slide 9

Slide 9 text

Data Dev成員組成 Data Scientist Data Engineer Data Dev Machine Learning Engineer AI Engineer

Slide 10

Slide 10 text

Data Dev成員組成 Data Scientist Data Engineer Data Dev Machine Learning Engineer AI Engineer 我待的Team !

Slide 11

Slide 11 text

參與最新、最有商業前景的生成式AI研究、開發 Stable Diffusion文生圖model研究 TTS model 文字轉聲音模型開發 LLM model Text Human Voice 大語言模型研究開發(Finetune、RAG) Text AI engineer在做什麼?

Slide 12

Slide 12 text

研究最新論文、程式、成功的AI商業模式 AI engineer需知道啥?

Slide 13

Slide 13 text

如何部署、展示自己的AI作品與價值 AI engineer需知道啥?

Slide 14

Slide 14 text

我學到的事 03 What I learn

Slide 15

Slide 15 text

認識LLM的強大與局限 : Long-tail data 已經看過較多的相關資料 (ex:論文Benchmark)表現優異 在LLM訓練階段(尤其Pretrain)相似資料太少 Finetune或Prompt無法給出滿意答案 Model Containation :高估模型能力 Response Hallucinations or Error : 無法落地使用

Slide 16

Slide 16 text

認識Demo規劃 v.s. 產品上線 不能只是Demo成功就好 穩定性、成本、功能性、維護性、合法性都很重要。 ex: 開源程式若沒有註記Apache 2.0可商用等等,可能會有侵權風險

Slide 17

Slide 17 text

認識AI的產業趨勢

Slide 18

Slide 18 text

認識AI的產業趨勢 美國AI科學家、AI部署工程師職缺遽增 懂技術又懂客戶需求的AI工程師最吃香

Slide 19

Slide 19 text

實習生活長什麼樣子 04 Intern in Data Dev

Slide 20

Slide 20 text

Internship 用到的技能包

Slide 21

Slide 21 text

Intern上班生活 :開會、研究、開發 公司會開Ticket追蹤進度,Intern有1-1的Mentor可以調整步調

Slide 22

Slide 22 text

Intern 上班生活 平常除了例行公司會議與開發任務外,LINE也給予員工很大進修學習空間 Google以公司為單位邀請參與的議程,不對外公開 實習生也可以參加

Slide 23

Slide 23 text

Intern 的活動花絮 & 上下班福利 TECHFRESH月 會 公司免費的 射飛鏢機 Data team正職慶生,吃蛋糕

Slide 24

Slide 24 text

Intern畢業分享會 讓不同Team的大家可以在實習結束時成果發表、交流

Slide 25

Slide 25 text

No content

Slide 26

Slide 26 text

No content

Slide 27

Slide 27 text

No content