Slide 1

Slide 1 text

多様な成熟度のデータ活用を総合支 援するKADOKAWA Connected のデータ組織について KADOKAWA Connected @saka1

Slide 2

Slide 2 text

あなたは誰? ● ID: @saka1 (さかいち or さかい) ● Twitter: @saka1_p ドワンゴでWebサーバサイドエンジニアでした 最近はKADOKAWA Connected(略称:KDX)という会社に 出向してデータエンジニア的なことをやっています ※ KDXはKADOKAWAの機能子会社です

Slide 3

Slide 3 text

本日のテーマ: データ組織(とか)

Slide 4

Slide 4 text

@saka1の所属組織 の事例紹介をします

Slide 5

Slide 5 text

なぜ発表: 中規模の事例紹介があんまりない 複数事業を扱うが、巨大企業ほどのリソースはない 組織やガバナンスを工夫しないとスケール効率が悪い 世界的企業 国内の巨大tech企業 扱うデータ量 ベンチャー スタートアップ データ基盤の 利用者数 KDXはこの辺 ● データ量: 約250TiB ● データ基盤利用者: 数百人 ● テーブル数: 約3500

Slide 6

Slide 6 text

資料の流れ ● KDXのデータ組織が扱う事業領域 ○ データを扱う組織は対象事業の構造に影響を受ける ○ 対象事業はどんな状況なのか? ごく簡単に紹介 ● 各事業のデータ利活用推進のための組織体制 ○ どういうチーム編成? ○ どんな工夫をしている? ● ここ数年で我々が学んだこと ○ 何が上手くいって、何が反省点だった?

Slide 7

Slide 7 text

事業領域 KADOKAWAグループの多様な事業の難しさ

Slide 8

Slide 8 text

KDXのデータ組織の位置 ● KADOKAWAグループ各社に「データ基盤」「データ分析支援」 などの各種サービスを提供している ○ 歴史的にはドワンゴのデータ分析系の部署から派生・発展 KADOKAWA Connected 今回お話する データ組織 KADOKAWAグループの他の企業(たくさんある) ドワンゴ KADOKAWA KADOKAWA Game Linkage バンタン サービス提供 etc etc

Slide 9

Slide 9 text

KADOKAWAグループ = 出版? ● 出版はKADOKAWAの祖業であり存在感は大きい ● 出版のみならず、映像、ゲーム、Webサービス、教育、MD、コトビジネス、イン バウンド関連などの幅広い事業を展開 ○ ECサイト: 「電撃屋」 ○ Webサービス: 「ニコニコ」 ○ コトビジネス: 「ところざわサクラタウン」 ○ 教育事業: 「バンタン」 ※ これらはあくまで KADOKAWA Connectedのデータ組織の取引先の例です 多数の事業でデータの利活用は求められている

Slide 10

Slide 10 text

データ利活用を考える上での対象事業の特徴 ● 特徴であり難しいところ ○ データ利活用の成熟度が非常にばらついている SQLとTableauで 仮説検証を回せる ダッシュボードが欲 しい まずは何をすれば いいですか?

Slide 11

Slide 11 text

データ利活用を考える上での対象事業の特徴 ● 対象事業の組織の状況にもばらつきがある 事業にデータ活用 の専門部署がある ある部署では、 データ活用への期 待が高まっている 担当者が1人で 頑張ろうとしている

Slide 12

Slide 12 text

参考: 成熟度に応じた組織構造 ● 『実践的〜』3章ではデータ活用の成熟度に応じた組織モ デルが提示されている ○ 集権型 ○ 分権型 ○ ハイブリッド型 ● 我々の場合は「いろいろ混ざっている」複雑な状態 ○ 個々の事業によって次の課題が違う ○ 歴史的経緯でドワンゴはセルフサービス化まで進んでいる ■ 他の事業は道半ばなことが多い

Slide 13

Slide 13 text

KDXのデータ組織の 編成・工夫

Slide 14

Slide 14 text

現在のKDXのデータ組織 データプラットフォーム サービス データソリューション サービス データコンサルティング サービス ※ 実態はもう少し複雑ですが本筋に影響がないため省略しています ● 大きく見ると3サービス(チーム)が分業している

Slide 15

Slide 15 text

データプラットフォームサービス データプラットフォーム サービス Snowflakeのユーザ管理や コスト最適化など 認証システム(Auth0)管理 ● データ基盤の管理をする ● 利用者の最大公約数の機能 を整備していく ○ セルフサービス化がんばる ○ 運用コストがデータの量に比 例しないように Fluentdクラスタ, Embulkの提供

Slide 16

Slide 16 text

データソリューションサービス データソリューション サービス ● プラットフォーム上のデータ から価値ある情報を抽出す るのが仕事 ● プラットフォームと分業 ○ プラットフォーム上のデータの 詳細を知っている ○ プラットフォームの外側は知ら ない ETL/ETL用のシステム管理 データカタログの整備 機械学習アプリケーション開発 BIツール(Tableau)提供

Slide 17

Slide 17 text

データコンサルティングサービス データコンサルティング サービス ● 顧客接点の確保と課題整理 ○ データで困ったら KDXに相談が来るように ○ 抽象的な要求を技術の問題に 落とし込む ○ データ利活用をしたい人を掘り 起こしていく ● リテラシー向上施策 ○ 利用者のトレーニング 相談窓口の提供 リテラシートレーニング プロジェクトの立ち上げ支援

Slide 18

Slide 18 text

我々なりの工夫点とは? ● チームを「サービス」として振る舞わせる ○ オーナーがいる ○ サービスメニューを設定している ○ 管理会計の単位としている

Slide 19

Slide 19 text

イメージ XXXXサービス ● サービスには オーナーがいる ○ 1人 ○ ロードマップの策定や タスクの推進に関する責任が 移譲されている

Slide 20

Slide 20 text

イメージ XXXXサービス ● サービスには メニュー設定がある ○ 何を提供するか ○ 何円かかるか ○ 品質基準はどうなっているか ● サービス間および顧客間と のインタフェース定義 アクセスログをデータ基 盤にストリーミング転送し ます 対象アクセスログ1件に つき○万円/月 リードタイムは標準○日

Slide 21

Slide 21 text

イメージ XXXXサービス ● サービス単位で 会計処理する ○ 原価どうなってる? とか ● 理想は、全てのサービスが 黒字を維持拡大できること ※ 例えばデータ基盤はコストセンターと見なされや すいので「サービスを提供している」と処理すること で、価値測定の近似をしやすくしている 今月の収支 収入◯円 費用△円 うち人件費XX円、AWS 費用YY円、…… 変動要因: 円安でAWS が値上がりした

Slide 22

Slide 22 text

学んだこと 上手くいったり、いかなかったり

Slide 23

Slide 23 text

結局その組織構造は上手く行ってる? ● 良いところは結構ある ○ メニューの明記でサービス間の疎結合化が促進される ■ 摩擦が減った ○ オーナーへの高い裁量・権限移譲 ● コンサルティングサービスの整備は有効だった ○ 整理されない雑多な要求が開発チームに流れ込む前に交通整理 ○ 問題が何なのか把握するほうが先決なことは多い

Slide 24

Slide 24 text

結局その組織構造は上手く行ってる? ● どうしても難しい箇所は残っている ○ 管理会計が複雑すぎて理解が難しい ○ サービスのオーナーの負荷が高い ■ 小さいとはいえ会計上の処理までできなければならず、 要求スキルが多い ○ メニューがきれいに分割できない箇所がある ■ 抽象的な業務は「まず相談してください」みたいになりがち

Slide 25

Slide 25 text

終わりに 発表時間はたぶんギリギリ

Slide 26

Slide 26 text

まとめ ● KDXのデータ組織は、多様な成熟度の事業のデータ利活用を 推進していく立場にある ● 組織と制度的な工夫でそれに対応しようとしている ● 全部が上手く行っているわけではない ○ 常に課題があるので改善しようとしている

Slide 27

Slide 27 text

We are hiring! ● KDXでは求人をしています(2022年5月時点) ○ 株式会社KADOKAWA Connected 採用サイト ● Twitter DM等のカジュアルな連絡も歓迎します 🙌 ○ 例: ■ カジュアル面談したい ■ データ基盤について雑談したい