2020/10/16(金) に開催したExploratory データリテラシー・サロン#1のスプライングローバル株式会社様のご登壇資料です。
BIからその先のデータ活用へスプライングローバル株式会社 岩橋 智宏
View Slide
岩橋 智宏2016: Tableau Japan テクニカルサポート 出版:Tableau で始めるデータサイエンス2020-03: SPLINE GLOBAL BI x データサイエンスTableau データサイエンス勉強会FBグループ主催
データ活用の基礎から最先端までAI機械学習BIデータ分析Excelデータ基礎藤松 良夫共同創業者 社⾧ビジネス、デジタル領域エキスパート岩橋 智宏コンサルタントBI / MLエキスパートミハル・ファビンガー共同創業者AIエキスパートデータ活用トレーニングコンサルテーション
BIから始めるデータリテラシー向上をサポート・ オープンデータを利用・ Tableau 基礎講座・ 仮説検証・立案ワークショップ・ 企業研修・新人研修・ Tableau データサイエンス学習塾
何が起こったかなぜ起こったか何が起こるか?何をするべきか?過去と現在の可視化未来予測や人知を超えるインサイトを得るデータから得られる価値情報インサイト最適化価値4 Stages Of Data Analytics Maturity: Challenging Gartner's Model予測
「データリテラシー」って何だろう?昔は・・・読み 書き そろばん今は・・・データサイエンス⇒ データから何とか価値を生み出す力
ビジネスの理解データの理解データの準備予測モデルの作成モデルの評価展開と共有データから価値を生むためのプロセス材料の品定め材料の下ごしらえ加熱調理味見盛り付け提供
データの理解まずは可視化が基本。可視化で見えること、見えないこと
FIFA19(サッカー)データより選手の収入の合計が最も多い国はどこでしょう?
FIFA19(サッカー)データより選手の収入の平均が最も多い国はどこでしょう?
電力需要を理解しましょう電力はどんな時に需要が高まるでしょう?
データの準備本当に大変なのに!なぜわかってもらえないのか・・・
データの準備もとても重要!・中古マンション価格を予測したい・ 市区町村でユニオン・ 駅名マスターとジョイン・ NULL値の除去・ 外れ値(超高級物件)の除去・ 駅名表記のブレの除去・ 年号西暦変換・ IDのユニーク化・ 名寄せ機械学習の前にやることはたくさんある!!データがあるんだからすぐわかるでしょ?
可視化と準備を行ったり来たり・・・千駄ケ谷問題!!結合で駅がなくなる!
モデルの作成と評価
・ 築年数、広さ、駅から徒歩、東京駅から最寄駅までのの直線距離・・・線形重回帰のモデル作る
予測モデルの評価誤差=(実価格ー予測価格)をJR中央線の駅ごとに可視化
・Prophetで東京電力の電力需要予測モデルを作る・誤差=(実測値ー予測値)を可視化
正月GWお盆猛暑日GW正月 お盆
共有と展開どんなふうに盛り付けるか?皆が見たくなる、触りたくなる、人に伝えたくなる可視化とは?・・
https://public.tableau.com/profile/tomohiro.iwahashi#!/vizhome/TokyoElectricity_Propfhet_Demand/sheet20?publish=yes
https://public.tableau.com/views/IceCreamImagePCA2020-10-04/sheet1?:language=ja&:display_count=y&publish=yes&:origin=viz_share_link
ビジネスの理解最終的には何を成し遂げたいか・・・そしてデータへの興味と関心
ビジネスの理解データの理解データの準備予測モデルの作成モデルの評価展開と共有Exploratory のカバレージデータサイエンスのプロセスを高速に回すためのツール可視化・準備・モデル作成と評価・共有とカバレージが広い
ビジネスの理解データの理解データの準備予測モデルの作成モデルの評価展開と共有Python/R便利なツールは使う!ExploratoryAlteryxTableauTableau
Python で一からやろうとすると・・・
まとめ・データ活用は経験と勘から可視化→機械学習を使った予測へと成熟しニューノーマルとなる。・溢れるデータから価値を生み出すサイクルをスピードをもって回せる力が大事。・BIエンジニアこそデータサイエンスの世界へ!・Exploratoryをはじめとするツールをうまく使いこなしプロセスを素早く回す力が新しいデータリテラシーとなる。
データドリブン推進に必要なことFacebook Group 「Tableau データサイエンス弁勉強会での議論」データサイエンスが専門性が高すぎるといった印象データを謙虚に分析して受け入れる心構えデータ取得プロセスがそもそも存在しないCEO/トップがデータドリブンにならないと変わら無いデータに触り、楽しい、面白いと感じてもらうところから統計的モノの見方TableauやExploratoryなどの、データ専門家でない人にも使えるツールの普及身近なコンテンツの可視化と共有社内勉強会の実施
Airbnbの取り組み:DataUniversity
お気軽にお問合せ下さい。Eight: 岩橋 智宏Facebook Group:Tableau データサイエンス勉強会