Slide 102
Slide 102 text
データ前処理(データクレンジング)
● データ前処理
○ はじめから、整然データやワイドテーブルのような分析しやすいデータがあることはほぼないた
め、SQLなどデータベース言語やプログラミング言語を用いて、データをきれいに (cleansing)整形
する前処理(preprocessing)が必要
● データ前処理に使われるプログラミング言語やライブラリ、ツール等
○ SQL(BigQuery, Redshiftなど)
○ Pythonのpandas(その他、Polarsなど)
○ Rのdplyr, data.table
○ Excel・Google スプレッドシートなど表計算ツール
○ その他、分析の言語やツール
■ Julia, Spark, SAS, SPSS, Stata, Tableau Prep, MATLAB等
→ぜひ、表計算ツールに加え、まずはいずれか一つの言語を使えるようになりましょう!
とはいえ、経営層・従業員全員が、 SQLなど使いこなせるわけではない・・・
(*SQLは分析向きの列指向のDWHを紹介)