Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スタートアップにおけるデータマネジメントの始め方の事例紹介(datatech-jp Casua...
Search
10xinc
December 11, 2023
Technology
5
11k
スタートアップにおけるデータマネジメントの始め方の事例紹介(datatech-jp Casual Talks #5)
datatech-jp Casual Talks #5での発表資料です。
-
https://datatech-jp.connpass.com/event/270476/
10xinc
December 11, 2023
Tweet
Share
More Decks by 10xinc
See All by 10xinc
10Xでのデータ基盤の変遷とこれから: データマネジメントのリアル 〜BtoB企業3社の歩みとこれから〜
10xinc
6
8.7k
10Xが掲げるオリジナルの品質特性について #nihonbashitesttalk / 10X quality characteristic
10xinc
2
1k
株式会社10X - Culture Deck
10xinc
86
1.4M
データマネジメントを支える武器としてのメタデータ管理
10xinc
6
35k
Elementaryを用いたデータ品質の可視化とデータ基盤の運用改善
10xinc
9
17k
テストの完了をゴールにしない! ~仮説検証を繰り返し、開発・QA・ユーザーが交流しながら開発することで見えてくる理想の姿~ - #RSGT2024 #DevSumi / Shift left and Shift right
10xinc
13
9.7k
Dataplexとdbt-osmosisを活用した「がんばらない」データカタログとメタデータ管理の運用(Data Engineering Study #22)
10xinc
3
16k
データプロダクトとは何か
10xinc
7
6.2k
Security Team at 10X inc / セキュリティチームの今@開発共有会
10xinc
1
170
Other Decks in Technology
See All in Technology
Databricksで構築する初めての複合AIシステム - ML15min
taka_aki
2
1.3k
オニオンアーキテクチャで実現した 本質課題を解決する インフラ移行の実例
hryushm
13
2.7k
TinyMLの技術動向
kyotomon
2
260
生成AIの強みと弱みを理解して、生成AIがもたらすパワーをプロダクトの価値へ繋げるために実践したこと / advance-ai-generating
cyberagentdevelopers
PRO
0
120
よくわからんサービスについての問い合わせが来たときの強い味方 Amazon Q について
kazzpapa3
0
140
最速最小からはじめるデータプロダクト / Data Product MVP
amaotone
1
370
ガチ勢によるPipeCD運用大全〜滑らかなCI/CDを添えて〜 / ai-pipecd-encyclopedia
cyberagentdevelopers
PRO
2
140
現実のRuby/Railsアップグレード
takeyuweb
3
3.1k
Comparing Apache Flink and Spark for Modern Stream Data Processing
sharonx
0
180
キーワードの再整理のススメ ~テストタイプ/テストレベルで最適化!~/20241025 Midori Inada
shift_evolve
0
120
Jamstack でリニューアルするグリーグループのメディア
gree_tech
PRO
2
220
現地でMeet Upをやる場合の注意点〜反省点を添えて〜
shotashiratori
0
160
Featured
See All Featured
Become a Pro
speakerdeck
PRO
24
4.9k
It's Worth the Effort
3n
183
27k
Navigating Team Friction
lara
183
14k
Happy Clients
brianwarren
97
6.7k
How to Ace a Technical Interview
jacobian
275
23k
10 Git Anti Patterns You Should be Aware of
lemiorhan
653
59k
KATA
mclloyd
29
13k
Building Applications with DynamoDB
mza
90
6k
Designing on Purpose - Digital PM Summit 2013
jponch
115
6.9k
Making Projects Easy
brettharned
115
5.9k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
27
1.9k
Embracing the Ebb and Flow
colly
84
4.4k
Transcript
©10X, Inc. All Rights Reserved. スタートアップにおける データマネジメントの始め方の事例紹介 datatech-jp Casual Talks
#5 2023/02/13 株式会社10X 吉田康久 1
©10X, Inc. All Rights Reserved. 自己紹介 • 吉田 康久 ◦
Twitterやはてなidは@syou6162 / id:syou6162 • 株式会社10XでAnalytics Engineer ◦ 2022/09に入社 ◦ グロース本部 データサイエンス&エンジニアリング部に所属 ◦ データマネジメント / データガバナンスの仕事をしてます ◦ 京都から働いてます • これまでの職歴としては研究者(NLP) => Webアプリケーションエンジニア => データエンジニア => Analytics Engineer • 最近はdatatech-jpのオーガナイザーの一人をやってます 2
None
None
©10X, Inc. All Rights Reserved. スタートアップにおけるデータマネジメントの始め方 • DMBOKなどデータマネジメントの教科書的な本は存在する •
データ品質など個別のデータマネジメント課題の発表はコミュニティ内でもよく聞く • 一方で、データマネジメント全体の進め方についての個別事例はそれほど多くはない ◦ 自分自身知りたかった & 発表することでフィードバックが欲しい • 昨年9月に10Xに入社してからデータマネジメント観点でやったこと / 考えたことを共有します ◦ 進め方に絶対の正解があるわけではないと思うので、一事例として 5
©10X, Inc. All Rights Reserved. 本発表のアジェンダ • 入社してから感じた課題 ◦ 一人目職種かつオンラインでのオンボーディング
◦ 様々なデータマネジメントの課題が山積 • 社内一人目職種相談会の開催 • データマネジメント成熟度アセスメントの実施 ◦ 部内でのアセスメント ◦ 社内へのヒアリング ◦ 社内へのヒアリングを受けて再度優先度付け • 現状の課題 / 目指したい世界観を社内に伝える ◦ 10Xでのデータ利活用のToBe: ガードレールとセルフサービス化 ◦ 他職種への協力依頼の進め方 • アセスメントが現在のデータマネジメント関連の業務にどう役に立っているか 6
©10X, Inc. All Rights Reserved. 本発表のアジェンダ • 入社してから感じた課題 ◦ 一人目職種かつオンラインでのオンボーディング
◦ 様々なデータマネジメントの課題が山積 • 社内一人目職種相談会の開催 • データマネジメント成熟度アセスメントの実施 ◦ 部内でのアセスメント ◦ 社内へのヒアリング ◦ 社内へのヒアリングを受けて再度優先度付け • 現状の課題 / 目指したい世界観を社内に伝える ◦ 10Xでのデータ利活用のToBe: ガードレールとセルフサービス化 ◦ 他職種への協力依頼の進め方 • アセスメントが現在のデータマネジメント関連の業務にどう役に立っているか 7
©10X, Inc. All Rights Reserved. 入社してから感じた課題 • 一人目職種かつオンラインでの入社 ◦
自部門以外の主要な関係者との関係性がないところからスタート • データに関する様々な観点から課題がある ◦ どれをどういう順番でやるといいのか 8
©10X, Inc. All Rights Reserved. 一人目職種かつオンラインでのオンボーディング • データマネジメントを専門にする職種は10Xでは一人目 ◦
社内でデータマネジメントに関する認知はそれほどまだ高くない • データのことを全般的に責任を持つ自分の仕事は、一人ではなくAs One Teamとして取り組まな ければ価値が発揮できない / されない側面が大きいことも関係 • 実際、データに関連する職種の幅は広い ◦ 分析を専門とするアナリスト ◦ データを元にパートナーと会話するBizDev ◦ 分析の元データを担当することになる開発チーム ◦ セキュリティや個人情報などの扱いを相談するリーガルやコーポレートIT 9 理想 ともすると...
©10X, Inc. All Rights Reserved. データにまつわる課題例: 必要なデータはどれ?!問題 10 分析には正しいデータを使うことが必須 ...だけど現実は厳しい
BigQueryにはOrderって名前のテーブ ルがたくさんあるけど、自分の用途に 合っているのはどのテーブル ...? このテーブルな気がするけど、カラム AとカラムBの違いが分からな い...微妙に数字が違うけど、どっちを使えばいいの ... そもそもこのテーブルを管理しているの は誰なの... よく分からないけど、今回はこのテーブ ルで分析してみるか (案の定用途に 合ってないテーブルで手戻り発生 ) BizDevやアナリスト
©10X, Inc. All Rights Reserved. データにまつわる課題例: データ品質が低い 11 聞いてるだけで胃が痛い ...
やっとのことでそれっぽいテーブル が見つかったぞ... 分析に使いたいカラム、 20%くらい 欠損してるけど、なんで ... どうも去年の10月分までのデータ しか入ってないんだが ... えっ、そもそもデータ更新のバッチ が先月から止まってるの ?! こんな品質のデータではパート ナーの信用は勝ち取れないよ ... BizDevやアナリスト
©10X, Inc. All Rights Reserved. データにまつわる課題例: このデータどうやって作られてるの問題 12 エンジニアの悩み...データがどうやって作られているかの謎を解き明かすために我々はアマゾンの奥地に FireStore
GCS BigQuery(ローデータ) BigQuery上で 様々な加工... スプレッドシート上で 様々な加工... BI上で 様々な加工... 品質に問題があるって言われたか ら、このデータどうやって作られて るか見てみるか... 構成図もないから、 コードを読み解くしか ない。このテーブルを 作っているのはどこ だ... いくつもの層で加工されていて頭 が混乱してきた... この作り(アーキテク チャ)で求められてる 品質を満たすの無 理じゃないか... 元データもそういう 用途で使われること を想定していなかっ たらしい エンジニアやアナリスト
©10X, Inc. All Rights Reserved. データにまつわる課題例: 全体をいい感じに回さないといけない問題 13 各所からくる要望が溢れていて、困り果てる担当者 メタデータが整備されない
と、分析するまで大変です ! データ品質が高くないと業務 に支障が出ます! データアーキテクチャちゃん としないと要求に答えられな いです! データセキュリティ、ちゃんと してください! とにかく色んな要望があること だけは分かる。それ以外は何 も分からない... どれが本当に重要度が高く て、どういう順番でアプローチ すればいいんだ...
©10X, Inc. All Rights Reserved. 本発表のアジェンダ • 入社してから感じた課題 ◦ 一人目職種かつオンラインでのオンボーディング
◦ 様々なデータマネジメントの課題が山積 • 社内一人目職種相談会の開催 • データマネジメント成熟度アセスメントの実施 ◦ 部内でのアセスメント ◦ 社内へのヒアリング ◦ 社内へのヒアリングを受けて再度優先度付け • 現状の課題 / 目指したい世界観を社内に伝える ◦ 10Xでのデータ利活用のToBe: ガードレールとセルフサービス化 ◦ 他職種への協力依頼の進め方 • アセスメントが現在のデータマネジメント関連の業務にどう役に立っているか 14
©10X, Inc. All Rights Reserved. 社内一人目職種相談会の開催 • オンライン環境下で一人目職種として入社された方は他にもいる •
その方々に相談して知見を教えてもらうという会:「社内一人目職種相談会」の開催 • 合計14人にヒアリング ◦ Customer Support / Data Manager / Software Engineer in Test / Business Development / Corporate Strategy / Corporate Operations Manager / HR (Talent Acquisition) / HR(HRBP) / Product Manager / Corporate Engineer / Legal / Retail Strategy Manager / CCO 15 先駆者から知恵を拝借、先駆者はたくさんいた !
©10X, Inc. All Rights Reserved. 社内一人目職種相談会の開催 • データマネジメント観点でも効用は大きかった •
他職種の解像度が高まった ◦ 日々の仕事の進め方、最近の困り事 • データマネジメントで目指したい世界観を伝える ◦ 頭の中で考えるだけでは伝わらない ◦ 明示的に言語化して、社内でも周知していく • 他職種への期待を明示的に伝える機会 • 詳細は10X Blogに書いてます! 16 データマネジメント観点でもオススメです 前職では同職種3人目で入社 だったが、その時もやるとよ かったな...と感じました。オス スメです
©10X, Inc. All Rights Reserved. 本発表のアジェンダ • 入社してから感じた課題 ◦ 一人目職種かつオンラインでのオンボーディング
◦ 様々なデータマネジメントの課題が山積 • 社内一人目職種相談会の開催 • データマネジメント成熟度アセスメントの実施 ◦ 部内でのアセスメント ◦ 社内へのヒアリング ◦ 社内へのヒアリングを受けて再度優先度付け • 現状の課題 / 目指したい世界観を社内に伝える ◦ 10Xでのデータ利活用のToBe: ガードレールとセルフサービス化 ◦ 他職種への協力依頼の進め方 • アセスメントが現在のデータマネジメント関連の業務にどう役に立っているか 17
©10X, Inc. All Rights Reserved. データにまつわる課題例: 全体をいい感じに回さないといけない問題 18 各所からくる要望が溢れていて、困り果てる担当者 (=私)
メタデータが整備されない と、分析するまで大変です ! データ品質が高くないと業務 に支障が出ます! データアーキテクチャちゃん としないと要求に答えられな いです! データセキュリティ、ちゃんと してください! とにかく色んな要望があること だけは分かる。それ以外は何 も分からない... どれが本当に重要度が高く て、どういう順番でアプローチ すればいいんだ...
©10X, Inc. All Rights Reserved. データマネジメント成熟度アセスメントの実施 • 何がどれくらいできていてどういう優先度なのか、包括的には誰も分かっていなかった •
全体感を知るためにアセスメントを実施した ◦ 基本的にはDMBOKベース ◦ 詳細は前職のTech Blogに書いてます ◦ Why: 前々職でもやっていて、色々整理できるなという感触を持っている • 3段階で進めた ◦ 部内でのアセスメント: データ基盤を管理するデータに詳しい人の立場から ◦ 社内へのヒアリング: データ利用者、経営層、セキュリティ担当者、などなど ◦ 社内へのヒアリングを受けて再度優先度付け 19
©10X, Inc. All Rights Reserved. 第一段階: 部内でのアセスメント 20 • 成熟度レベルを5段階で評価
• レベル感が低いこと自体はここ では問題ではなく、レベル感の 認識を合わせるのが目的 • 社内での暫定的な優先順位も 付ける • アセスメントをすることで「この項 目にはあの課題も含まれる か...」という共通認識を持てたの もアセスメントを実施してよかっ たこと 参考: https://speakerdeck.com/yuzutas0/20200528
©10X, Inc. All Rights Reserved. 第二段階: 社内へのヒアリング • 社内のかなりの職種にヒアリング(計10回)
◦ BizDev / アナリスト / リーガル / データエンジニア / コーポレートストラテジー / SRE / CorpIT / PdM / 開発 • それぞれの職種に対してどういう観点のことを聞きたいかを事前に明らかにしてヒアリングに望 む • 注意: ヒアリングの場では問題解決は目指さない 21 データ利用者以外へのヒアリングも重要
©10X, Inc. All Rights Reserved. ヒアリングの質問とリサーチの質問 • ヒアリングの質問: データマネジメントの専門用語で質問しても、対象者が理解できるとは限らな い
• リサーチの質問: 対象者に寄り過ぎたヒアリングになっても、データマネジメントで必要な答えが 手に入るとは限らない • 事前に仮説は持ちつつも、ヒアリング当日は対象者から引き出すことをメインにする(誘導し過ぎ たり、Yes / Noで終わるような質問ばかりしない) ◦ 詳細はBlogでも紹介してます! 22 コミュニケーション能力が足りない部分は事前準備でカバーする データ品質での具体例 データ基盤も社内向けの プロダクトと捉えると、 UXリ サーチの考え方が役に 立った!
©10X, Inc. All Rights Reserved. 第三段階: 社内へのヒアリングを受けて再度優先度付け 23 取り組む順番を依存関係の DAGとして定義
• 社内へのヒアリングの結果、部 内とそれほど大きなズレがないこ とが分かった • データセキュリティとデータ品質 は特に優先して進めたい • しかし、それを効率的に進めるた めには先にやる必要がある項目 がある • 何をどういう順序で解くとデータ ガバナンスとしてよさそうか、依 存関係を決めた 特に優先して進めたい項目 !
©10X, Inc. All Rights Reserved. 本発表のアジェンダ • 入社してから感じた課題 ◦ 一人目職種かつオンラインでのオンボーディング
◦ 様々なデータマネジメントの課題が山積 • 社内一人目職種相談会の開催 • データマネジメント成熟度アセスメントの実施 ◦ 部内でのアセスメント ◦ 社内へのヒアリング ◦ 社内へのヒアリングを受けて再度優先度付け • 現状の課題 / 目指したい世界観を社内に伝える ◦ 10Xでのデータ利活用のToBe: ガードレールとセルフサービス化 ◦ 他職種への協力依頼の進め方 • アセスメントが現在のデータマネジメント関連の業務にどう役に立っているか 24
©10X, Inc. All Rights Reserved. 現状の課題 / 目指したい世界観を社内に伝える • アセスメントにより、現在の社内のデータに関わる課題やそれに対する進め方は一定整理でき
た • そのまま日々の仕事を進めるではなく「どういう課題感があってどういう世界を目指すことでデー タマネジメントが会社に貢献していきたいと思っているか」を社内に広く伝えていく ◦ Good Morning Talkという社内の勉強会の場があるので、その場を活用して社内に展開 25
©10X, Inc. All Rights Reserved. 課題例: アナリスト工数足りない問題 • 契約パートナー数は順調に増加している
• アナリストは現在2名 ◦ すでに工数はパツパツ気味。パートナー数に線形で増やす想定ではない ◦ 様々な部署から簡易なデータ分析やデータ抽出の依頼もきており、時間が細切れになって、深い分析をする時間がな かなか取れない ◦ (当然ながら)依頼があるのが悪いのではなく、元のデータが難しかったり罠が多いことでアナリストしか分析できない状 況になっているのが本質 26 パートナーA パートナーB パートナーC パートナーD パートナーE … アナリストX アナリストY アナリストZ
©10X, Inc. All Rights Reserved. 課題例: DWHのカバレッジが不足 • グロース本部でDWHの開発を進めている
◦ data vaultなど業界の中でも割と先進的なアーキテクチャの取り組みができている ◦ 作成済みの範囲だとデータ品質は高い • 一方でカバーできている範囲はまだまだ局所的 ◦ 開発面でのリソースが足りていない ◦ 対応すべきデータソースが増えてきた場合や開発者が増えてきた場合にスケールするためのドキュメントも整備が必 要 ◦ 開発に必要な要件が明らかになっていない面も多い 27
©10X, Inc. All Rights Reserved. その他の課題例 • データ品質 ◦ ダッシュボード間でGMVの数字が合わない、どれを信用してよいのか分からない
◦ そもそも同じような目的のダッシュボードが複数存在している(SSoTになってない) • データセキュリティ ◦ 人数が少なかった頃の名残 ▪ 30~50人くらいの頃 ◦ 要件に対して広い権限の付与 ◦ 現状の組織体制に合わせた形にしていく必要がある ▪ 現在は100名を越えたあたり 28
©10X, Inc. All Rights Reserved. データマネジメント / データガバナンスとは • データにまつわるよく起きる課題領域(例:
メタデータ / データ品質 / データアーキテクチャ)をま とめたもの ◦ データにまつわる足元の様々な課題に対応しながら ◦ データをビジネスに生かしていくためのToBeを描いて ◦ それを継続的に維持 / 進化させる営みを組織的に行なうこと • 個々の問題領域だけでなく、全体感をどう進めていくかがデータガバナンスという伝え方をして います ◦ データのセキュリティだけやってる人、DWHだけ作ってる人と捉えられないようにする 29 この辺を色々やるのが仕事です • 10Xでデータマネジメントやデータガバナンスに責任を持つのは Analytics Engineer • 世の中でのAnalytics Engineerはもう少しスコープが狭い気がす るけど、10Xだとそこだけでは不十分かなと思ってる
©10X, Inc. All Rights Reserved. 本発表のアジェンダ • 入社してから感じた課題 ◦ 一人目職種かつオンラインでのオンボーディング
◦ 様々なデータマネジメントの課題が山積 • 社内一人目職種相談会の開催 • データマネジメント成熟度アセスメントの実施 ◦ 部内でのアセスメント ◦ 社内へのヒアリング ◦ 社内へのヒアリングを受けて再度優先度付け • 現状の課題 / 目指したい世界観を社内に伝える ◦ 10Xでのデータ利活用のToBe: ガードレールとセルフサービス化 ◦ 他職種への協力依頼の進め方 • アセスメントが現在のデータマネジメント関連の業務にどう役に立っているか 30
©10X, Inc. All Rights Reserved. 10Xでのデータ利活用のToBe • データマネジメントやデータガバナンスを推し進めていった先には何が待っているのかを社内に 伝えていく ◦
依頼される人にとっての協力するインセンティブを説明していく • キーワードは「ガードレール」と「セルフサービス化」 ◦ 今後パートナーのローンチの増加やそれ以降のグロースフェイズでアナリストがボトルネックになる可能性は高い • 特にセルフサービス化は人によって思い浮べるイメージが大分違う可能性が高いので、詳細説 明します 31
©10X, Inc. All Rights Reserved. ガードレール • パートナーのグロースをアナリストだけの力だけでなく、BizDevやPdMなどその他の職種の方で もセルフサービスで行なうガードレールを敷いていくためのフレームワーク
• レールの上を走ってもらう分にはスピード出してもらっても、安心・安全・簡単に分析できるよ • そもそもレールの外を走れない、走っていたら検知できるようにしていく ◦ 具体的にはデータセキュリティやデータアーキテクチャの強化 32
©10X, Inc. All Rights Reserved. セルフサービス化: きっとこうではない例 • みんなデータに広くアクセスできて、みんなが必要なSQLを自前で書いている
33 生データを何とか読み解 いて、分析AをやるSQL を書いてみたよ みんなSQL書けたほうが いいんだよね! いいテーブルができた ら、ここに置いとくね !
©10X, Inc. All Rights Reserved. セルフサービス化: きっとこうではない例 • みんなデータに広くアクセスできて、みんなが必要なSQLを自前で書いている
◦ かっこいいと言えばかっこいい(?)かもしれないけど、10xさせる中で多分これはすぐスケールしなくなる 34 生データを何とか読み解 いて、分析AをやるSQL を書いてみたよ このケースを考慮しないと、 分析の結論が逆になること もあるよ みんなSQL書けたほうが いいんだよね! スキルとしては書けたほう がよいけど、組織で考えると みんな書けるべきかはよく 考える必要があるよ いいテーブルができた ら、ここに置いとくね ! そこはその用途に適した場 所ではないよ
©10X, Inc. All Rights Reserved. セルフサービス化: ガードレールを敷いた上で自走 35 複雑な生データ DWH
データマート BIツール (Tableau)
©10X, Inc. All Rights Reserved. セルフサービス化: ガードレールを敷いた上で自走 36 複雑な生データ DWH
データマート BIツール (Tableau) Analytics Engineerやデータ に詳しいアナリストが汎用的 なデータを切り出す アナリストやデータに詳しい BizDev / PdMがユースケー スに特化したデータを作る データにそれほど詳しくない BizDev / PdMがSQLを書か ずにさっと分析できる 安心・安全にデータが 使えるね 簡単にデータが使えるね
©10X, Inc. All Rights Reserved. セルフサービス化: ガードレールを敷いた上で自走 37 複雑な生データ DWH
データマート BIツール (Tableau) データ品質を満たせるアーキテクチャは Analytics Engineerで担保 Analytics Engineerやデータ に詳しいアナリストが汎用的 なデータを切り出す アナリストやデータに詳しい BizDev / PdMがユースケー スに特化したデータを作る データにそれほど詳しくない BizDev / PdMがSQLを書か ずにさっと分析できる リーガルやSREと相談した上で、個人情報を 適切に扱えるようにAnalytics Engineerが設 計、運用 簡易かつ個別の分析はアナリスト に依頼する必要はない。アナリス トはより難易度の高い分析に集 中できるように 取り回しがよいDWHがあることにより、個別のユースケース にもデータ品質を担保しつつ対応がしやすい メタデータが整備されていることで、ユースケースに沿ったも のかが自分で判断できる より適切なSQLになるようにAnalytics Engineerがレビュー、分 析方法自体はアナリストがレビューする場合も 安心・安全にデータが 使えるね 簡単にデータが使えるね
©10X, Inc. All Rights Reserved. 本発表のアジェンダ • 入社してから感じた課題 ◦ 一人目職種かつオンラインでのオンボーディング
◦ 様々なデータマネジメントの課題が山積 • 社内一人目職種相談会の開催 • データマネジメント成熟度アセスメントの実施 ◦ 部内でのアセスメント ◦ 社内へのヒアリング ◦ 社内へのヒアリングを受けて再度優先度付け • 現状の課題 / 目指したい世界観を社内に伝える ◦ 10Xでのデータ利活用のToBe: ガードレールとセルフサービス化 ◦ 他職種への協力依頼の進め方 • アセスメントが現在のデータマネジメント関連の業務にどう役に立っているか 38
©10X, Inc. All Rights Reserved. 他職種への協力依頼: アナリスト向け • より深い呼吸をした上で本質に迫る分析をして欲しいと思っています
• そのためにもDWHやデータマートの構築に力を貸してください 39
©10X, Inc. All Rights Reserved. 他職種への協力依頼: SRE / リーガル /
コーポレート向け • ガードレールをセキュリティや法的な観点からも強固なものにしていくには、Analytics Engineer だけでは困難です • 皆さんが持っているアーキテクチャ設計や権限設計、法律などの観点からレビューを通じて力を 貸してください 40
©10X, Inc. All Rights Reserved. 他職種への協力依頼: エンジニア向け • いくらDWHやデータマートを整備しても、生データが重要なことは揺がない事実です
• 生データの仕様やその変更、意図など色々質問に行くことがあると思います • 特にイベントログはデータとしてまだ取れていないものも多いです • Analytics Engineerやアナリストが食材(=生データ)を生かしていくためにも、力を貸してください 41
©10X, Inc. All Rights Reserved. 協力依頼のサマリー: • あなたのデータの困りはみんなの困り ◦
社内でも同じように困っている人がきっといるはず • みんなのデータの困りを解決させるためのフレームワークがデータマネジメント ◦ 個別の課題を解決する、というよりはある程度問題を汎化させて考える ◦ 色んな会社でデータ周りの課題になっていることをノウハウの塊のようなもの • データを使ってStailerを10xさせていく仕組みをデータマネジメントで作っていきたい ◦ データマネジメントは一般的なフレームワーク ◦ 10Xの現状に合わせてカスタマイズして進める必要がある • Analytics Engineer(10Xでは現在私のみ!)だけでは困難なので、様々な職種の方と#AsOneTeam で実現していきたい 42 データマネジメント + #AsOneTeam
©10X, Inc. All Rights Reserved. 本発表のアジェンダ • 入社してから感じた課題 ◦ 一人目職種かつオンラインでのオンボーディング
◦ 様々なデータマネジメントの課題が山積 • 社内一人目職種相談会の開催 • データマネジメント成熟度アセスメントの実施 ◦ 部内でのアセスメント ◦ 社内へのヒアリング ◦ 社内へのヒアリングを受けて再度優先度付け • 現状の課題 / 目指したい世界観を社内に伝える ◦ 10Xでのデータ利活用のToBe: ガードレールとセルフサービス化 ◦ 他職種への協力依頼の進め方 • アセスメントが現在のデータマネジメント関連の業務にどう役に立っているか 43
©10X, Inc. All Rights Reserved. 現在データマネジメントでやっていること • データセキュリティ ◦ 付与する権限を最小化
◦ IaCでの設定のコード化、変更におけるレビューフローの整備 • データウェアハウス ◦ カバレッジの増強 ◦ 開発者や必要なmart / データソースが増えた際にも対応できるアーキテクチャ設計やドキュメント整備 ◦ 旧データウェアハウスの撤退、MetabaseからTableauへの移行 • アセスメントをやってみて、↑はどう変わったか ◦ 他にもやることはたくさんあるものの、優先度や納得感が得やすくなった / 説明もしやすくなった ◦ 特に他職種とのコミュニケーション時の前提となる背景が共有できたのは大きかった ◦ 日々のタスクを倒していくだけでなく、どういう世界を実現していきたいかを言語化する機会になったのもよかった 44
©10X, Inc. All Rights Reserved. まとめ • スタートアップにおけるデータマネジメントの始め方の事例を紹介しました ◦
一人目やオンライン環境下での難しさとどう向き合っているか ◦ アセスメントと通じて、データマネジメントの課題をどう優先順位を付けているか ◦ 社内への展開の仕方 ◦ 日々の業務への生かし方 • 一事例に過ぎないとは思うので、他社さんでの事例も今後聞いてみたい • 本発表へのフィードバックもお待ちしております! 45
None