Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SKL data analysis internship lecture 1

Adam
March 10, 2020

SKL data analysis internship lecture 1

Internal intern training for SKL.
Topic: python introduction & data visualization

Adam

March 10, 2020
Tweet

More Decks by Adam

Other Decks in Programming

Transcript

  1. 張祐誠 Experience 新光⼈壽 - 資料⼯程師 台灣⼈⼯智慧學校 - 第⼆期技術⼈班 聚陽實業 -

    海外系統專案專員、機械⼯程師 Job Description 資料分析、後端API串接 ⾃然語⾔處理與機器視覺應⽤開發 GPU伺服器管理 偶爾客串⼀下內部教育訓練 2
  2. My Lectures and Topics 3 課程序 課程主題 Lecture 1 Python

    Introduction & Data Visualization Lecture 4 Pytorch Introduction
  3. Table of Contents 6 Python introduction Data science introduction Common

    applications Popular framework Other things in python Data visualization
  4. Key Takeaways 45 了解要開發哪種應⽤ 選擇對應的套件 選擇喜歡的IDE Pycharm, Sublime text, Jupyter

    Vscode, Atom… 程式之外但很重要的事情: PEP Documentation Testing Version Control Functional Programming OOP Project Management
  5. 描述性統計 49 Min 25% Mediam 75% Max Min 12.5% 25%

    Mediam 75% 87.5% Max Min 12.5% 25% Mediam 75% 87.5% Max Midhinge Mideight Min 12.5% 25% Mediam 75% 87.5% Max Midhinge Mideight Counts Mean STD
  6. 這張圖表有什麼問題? 51 ⼩組活動 國內各⼈壽公司近⼀年在Google的搜索熱度 9.524 19.048 28.571 38.095 47.619 57.143

    66.667 76.19 85.714 95.238 2018-03-04 2018-03-25 2018-04-15 2018-05-06 2018-05-27 2018-06-17 2018-07-08 2018-07-29 2018-08-19 2018-09-09 2018-09-30 2018-10-21 2018-11-11 2018-12-02 2018-12-23 2019-01-13 2019-02-03
  7. 做了⼀些調整後 52 國內各⼈壽公司近⼀年在Google的搜索熱度 搜索熱度(標準化後數量) 0 25 50 75 100 搜索時間(⽇期)

    2018-03-04 2018-03-25 2018-04-15 2018-05-06 2018-05-27 2018-06-17 2018-07-08 2018-07-29 2018-08-19 2018-09-09 2018-09-30 2018-10-21 2018-11-11 2018-12-02 2018-12-23 2019-01-13 2019-02-03 新光⼈壽: (Taiwan) 國泰⼈壽: (Taiwan) 富邦⼈壽: (Taiwan) 台灣⼈壽: (Taiwan)
  8. 我們如何看圖表? 53 國內各⼈壽公司近⼀年在Google的搜索熱度 搜索熱度(數量) 0 25 50 75 100 搜索時間(⽇期)

    2018-03-04 2018-03-25 2018-04-15 2018-05-06 2018-05-27 2018-06-17 2018-07-08 2018-07-29 2018-08-19 2018-09-09 2018-09-30 2018-10-21 2018-11-11 2018-12-02 2018-12-23 2019-01-13 2019-02-03 新光⼈壽: (Taiwan) 國泰⼈壽: (Taiwan) 富邦⼈壽: (Taiwan) 台灣⼈壽: (Taiwan) 1. 先看標頭 2. 座標軸名稱 3. 座標軸單位 4. 座標軸範圍 5. 看圖表Pattern & 圖⽰
  9. Line Chart 57 0 25 50 75 100 4 ⽉

    5 ⽉ 6 ⽉ 7 ⽉ Pros: 通常⽤於評估因時間變化 ⽽改變的趨勢 Cons: 結構簡單 通常需結合其他資訊比對
  10. Bar Chart 58 0 25 50 75 100 4 ⽉

    5 ⽉ 6 ⽉ 7 ⽉ Pros: 通常⽤於評估事件的頻率 Cons: 結構簡單 通常需結合其他資訊比對
  11. Python繪圖⼯具比較 76 繪圖⼯具 優缺點描述 Matplotlib 預設的圖表較簡單 但可⾼度客製化 Seaborn 美化版的Matplotlib 可以⽤Matplotlib的語法客製化

    Bokeh 可以做互動式圖表 可⽤前端的語法進⾏客製化 Plotly 可做互動式圖表 圖表挺美觀的 Dash 建立圖表儀表板的好⼯具
  12. Key Takeaways 77 學習如何描述⼀份資料 描述性統計(5, 7, 9, 12…) 學習如何繪製圖表 知道圖表繪製的注意事項

    了解有什麼圖表可以分析 使⽤Python套件繪製圖表 Matplotlib Seaborn Bokeh Plotly Dash
  13. Homework 78 • 上網找⼀個你喜歡的資料集 Kaggle, UCI, 台灣開放資料平台...等,找⼀組資料集 • 做出10個圖表,圖表種類可重複 •

    但⾄少應包含5種以上不同的圖表 • 下次上課時,做⼀個5分鐘的報告 • 說明你為什麼選擇這個圖表,以及得到什麼資訊