Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データ分析コト始め - Python を学ぶ前に考えたいこと

データ分析コト始め - Python を学ぶ前に考えたいこと

「DXを組織に注入するんだ!」「それにはデータだ!」
未だにその声は聞きますし奮闘している皆様を日々目の前にしています。その施策としてスキリングの一環として Python を社員向けのトレーニングとして組み込む施策をしている会社・組織を多数見ています。そして、そのために利用目的が明確ではないセキュアなデータ基盤案件も多く走っています。その皆様のご尽力には本当に頭が下がります。

今一度、考えなおしませんか? Pythonは誰の目線から見て「簡単」なんでしょうか?
データの分析をする主体は誰なんでしょうか?
そして、多くの皆さんのPC/スマホには、会社から武器としてExcelは入っていませんか?
そもそもデータの分析とはどういうものなのか?ご存じでしょうか?通常のITシステムの開発と何が違うのでしょうか?

今からでも遅くはありません。今からでも考え直すきっかけにしてください。

More Decks by Daiyu Hatakeyama | @dahatake | 畠山 大有

Other Decks in Technology

Transcript

  1. データの読み方 コト始め - Python 勉強する前に、Excel で出来る事もたくさんある! - 畠山 大有 |

    Daiyu Hatakeyama Architect && Software Engineer && Applied Data Scientist Microsoft Japan /dahatake @dahatake /in/dahatake /dahatake /dahatake
  2. 素材 編集 考査 編成 分析 オンエア 配信 企画 女子高生層に 人気のあるタレントは

    Yさん だよ SNSで、 Microsoft が 流行っているって テレビって お年寄りしか 観ていないって ミュージシャンのX さん、 zzz 県で 爆発的に人気って聞いた コールセンターに あの報道良かったって 連絡あったみたい 番組連動をCloud でやれば、視聴率 増えるって サイマル配信して、 本当にテレビに若者が 返ってくるの? VoDの会員数は 増やすために XXX のコンテンツ出して みようか? 何に基づいて、 会社のリソース (人・モノ・カネ・時間) を使う「判断」をしているのですか?
  3. Chicago 市には 何人のピアノ調律師がいますか? 200 調律師 1000 調律回数 毎年必要な 調律回数 20万

    ピアノ 毎年調律が必要 400万 世帯 50 営業週/年 5 営業日/週 8 営業時間/日 2 作業時間/調律 20軒に1軒は ピアノがある ざっくり 回答 (移動時間 など引いて) Chicago 市の人口は約900万人
  4. Python は プログラミング言語 スクリプト言語 豊富なデータ分析用 パッケージ (習得が容易) 実装が容易 属人化 バージョンアップで

    互換性は頻繁に失われる バージョン固定のためのコンテナ化が推奨 コンテナ の知識・インフラ プログラムの 知識は必須 大きなデータも 扱える (PySpark) Spark インフラ それは… GUI ツールで出来なくて、Python じゃないと処理が難しいのか?
  5. No-Code / Low-Code のインパクト これまで Excelが ナレッジワークを変えてきたように、 Low-Code・No-Code 技術のようなツールの登場によって、 現場のエキスパートが

    現場でオートメーションを実現し、製造業の生産性を一気に変えるようなパラダイム変化が起こっている Excel コードを書かずとも出来るコトは多々ある! Power BI Desktop (無料版)
  6. Cloud Only の弊害 Data を持ち出せない インターネットへの接続 Sustainability の観点 手元の PC/Mac

    以外に 稼働している Computer PC だけかつオフラインでも作業が出来る!😊 Data は PCの中 インターネットへの接続不要 手元の PC/Mac のみ フェーズを踏める。 うまくいったら Cloud も使えばいい ほぼ無料のアプリのみ Excel Power BI Desktop (無料版)
  7. Cloud only の弊害 Data を持ち出せない インターネットへの接続 Sustainability の観点 手元の PC/Mac

    以外に 稼働している Computer PC / Mac のみでのハンズオン/ワークショップを実施中 Data は PCの中 インターネットへの接続不要 Sustainability の観点 手元の PC/Mac のみ フェーズを踏める。 うまくいったら Cloud も使えばいい ほぼ無料のアプリのみ それは PC で処理できない Big Data なんでしたっけ? Excel Power BI Desktop (無料版)
  8. 畠山 さんの 視聴 ログ データ 日付 再生 回数 視聴者 ID

    番組 説明 コスト カテゴリー 番組名 など… Viewer minutes データをここまで整形するのも実は一苦労…
  9. • 各番組の視聴率は? • 視聴トップ10の中で増えたのは? • 視聴者数と演者の関係は? • テレビとネットでの視聴数に 影響のある要因は? •

    視聴者数最低の番組は 何が原因? • 次の四半期の視聴数は どの要因で増やせる? 何を知りたいのか? = 仮説 ビジネス上の知りたい事を考えるのが、難しい 何が起こっているのか? 現状把握 なぜそれが発生したのか? 何の 相関関係があるのか? 次に何をすればいい? そのための 予測は?
  10. Power BI の場合 取得 保存 加工 可視化 Power Query 搭載

    ファイルとして グラフ Power Query
  11. • ビジネス上の課題の仮説 • 文章化していること • 例: 一昨年より実施している施策の売り上げ増への効果を知りたい • 生データ •

    集計しないもの。計算はツールの方でいくらでも出来る • データの意味・価値の分かる人の参画 • 丸投げできない データの分析に必須な 3つの武器
  12. 1 2 3 高品質な17,000のコース (日本語は900コース以上) ビジネス、テクノロジー、クリエイティブなどの多様なカテゴリー から成る学習コースをご提供 データに基づいたコース設計と パーソナライゼーション機能 リンクトインの会員データをもとにコース開発を実施

    リンクトインプロフィール情報(スキル、経験等)に 基づいた推奨コースをAI機能を使い受講者に表示 マイクロラーニング 短時間でPC・モバイルからいつでもどこでも受講可能 LinkedIn ラーニング
  13. Microsoft Learn Step-by-Step Achievements スムーズな学習環境 ▪ 無料 ▪ 日本語対応 ▪

    ブラウザーのみでOK ハンズオン環境も含めて ▪ ダウンロード可能なサンプルコード ▪ Product/Service, 技術レベル, job role, などに応じたガイダンス ▪ Video, チュートリアル, ハンズオン ▪ スキルアップを促す ▪ ユーザー プロファイル毎に カスタマイズ www.microsoft.com/learn