Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データの民主化とデータパイプライン

msdtakashi
April 19, 2020

 データの民主化とデータパイプライン

第1回 DLG Cross (データマネジメントとデータパイプライン) の発表資料です。
https://data-learning-guild.connpass.com/event/170177/

データマネジメントの Why(なぜ必要か) What(どんな活動なのか) How(どうやるのか)について、 データ分析プロジェクトの成功例と失敗例を比べながら紹介します。
https://twitter.com/DataArch_masuda
#dl_guild

msdtakashi

April 19, 2020
Tweet

More Decks by msdtakashi

Other Decks in Science

Transcript

  1. フリーランスの データアーキテクト です。 フリーランスのデ ータアーキテクト です。 データ基盤の整備や BIの設計から作成ま で行っています。 趣味:料理

    最近は、毎晩 オンライン飲み会 用に作っています 30代・異業種か らのIT業界に入りま した。 4月から大学院生 になりましたが、 まだ未登校です。 @DataArch_masuda
  2. 民主化でやったこと(予定含む) • SQL講座 ◦ 目的:単純な集計をできるようにする。 ◦ 効果:変な依頼が減る。 ◦ 効果:レビュワーが増える。 •

    BIツール講座 ◦ 目的:BIツールの修正ができるようになる。 ◦ 効果:文字、レイアウトなど気にせず、ロジックに集中できる。
  3. 民主化でやったこと(予定含む) • データウェアハウスの整備 ◦ 目的:データウェアハウスを正しく理解してもらう。 ◦ タスク:エンジニア以外でもどんなデータなのかわかるようにする。 ◦ ポイント:エンジニア特有のデータ構造をやめる。 •

    データウェアハウスの非エンジニア向けドキュメントの整備 ◦ 目的:SQLを書きやすくするための説明。 ◦ タスク:テーブル構造を理解してもらう。 ◦ 効果:確認されることが減る。 ◦ 効果:適切な依頼が来る。(これ重要)
  4. 民主化でやったこと(予定含む) • データ活用MTGを開催 ◦ 目的:そもそも、どんな分析、データ活用をしたいのか? ◦ タスク:チームごとに、MTGを開催。目標を決める。 ◦ 効果:データ活用の意識が高まる。 •

    Slack対応チャンネル作成 ◦ 目的:気楽に相談してもらえる環境を作る。 ◦ 効果:コーディング(SQL)、構築(BI)に過度な時間を割かせない。 ◦ 効果:サポートする空間を作る。
  5. 「コード規約トピック」 • 予約語/関数は、大文字にする。 • JOINのASに単文字を使わない。(変数名も) • スネークケースで書く。 • 接頭辞(prefix) /

    接尾辞(suffix)をつける。 • idというカラム名は使わない。 • 1行に1カラムにする。 • インデントは2文字(スペース)にする。 • AND,ORは改行して先頭に • SELECT単位でインデントを揃える。 • INNER JOINを使わない。 など