タイミーにおけるデータの利用シーンとデータ基盤の挑戦

Slide 1

Slide 1 text

2024/09/26 タイミーにおけるデータの利用シーンとデータ基盤の挑戦 @marufeuille データマネジメントのリアル〜BtoB企業3社の歩みとこれから〜

Slide 2

Slide 2 text

自己紹介石井正浩 / @marufeuille 2022/8 タイミー入社 & DREチームJoin データ基盤の開発・運用やってます。最近はデータコントラクトの実現に悩んでます。最近のブームはコーヒー☕を淹れたり (手鍋で)煎ったりすることです。

Slide 3

Slide 3 text

タイミーの実績スキマバイト No.1 ※1 ※2 [調査方法]インターネット調査 [調査期間]2024 年 2 月 9 日~11 日 [調査概要]スキマバイトアプリサービスの実態調査 [調査委託先]株式会社マクロミル ※3 2024年9月時点　※4 2024年9月時点利用率・リピート率 ※1 ※2 導入事業者数 136,000企業ワーカー数 900万人 ※4 ※3

Slide 4

Slide 4 text

タイミーとは 4 ｢働きたい時間｣と｢働いてほしい時間｣をマッチングするスキマバイトサービス従来の「求人サイト」でも「派遣」でもない

Slide 5

Slide 5 text

目次 ● データ基盤の変遷と最近の課題 ● データコントラクトの導入と実践 ● まとめ

Slide 6

Slide 6 text

1 データ基盤の変遷と最近の課題

Slide 7

Slide 7 text

タイミーの従業員数の増加タイミーでは、2019年から2023年時点で、従業員数が86人→1000人規模まで増加した。

Slide 8

Slide 8 text

タイミーのデータ基盤の歴史 2018 アプリリリース DWH (BigQuery)へデータ集約 2020 Looker導入 & dbt導入 2021 2022 2023 2024 データモデリングをLookerからdbt へ移行 data streamによるCDC導入 / exposureによるアウトプットの管理ガバナンスの強化 DREの数 (正社員ベース) 1 1 1 -> 2 2 -> 4 4 -> 6 AEの数 (正社員ベース) 1 -> 2 2 1

Slide 9

Slide 9 text

アーキテクチャ(2022くらい)

Slide 10

Slide 10 text

アーキテクチャ(いま)

Slide 11

Slide 11 text

アーキテクチャ(いま) 利用ユースケースの増加キワドイユースケースも増加データの増加とアーキテクチャの複雑化

Slide 12

Slide 12 text

最近このデータってどう言う意味？うーん、わからんです。問い合わせてみます。データをBQに繋ぎこみたいリソースないんで待ってください今日集計しないと顧客影響でるんだけど！！昨日のリリース影響でした。すぐ直します！！

Slide 13

Slide 13 text

ある時の社内勉強会

Slide 14

Slide 14 text

2 データコントラクトの導入と実装

Slide 15

Slide 15 text

データプロダクト (理想的な)メッシュいいなあデータソースデータプロダクトのオーナー処理いい感じのモデルインフラデータプロダクトデータプロダクト

Slide 16

Slide 16 text

といってもメッシュは難しい現実問題、組織構成が合致しない - 開発部門はともかくとしても、事業部にエンジニアがいることは極々稀なので、分担できる範囲がかなり異なりそう - 活用イメージはあるが、データについてはわからない、とか - そもそも運用なにすればいいの？ - 開発部門にしてもデータに割ける人員がいるかというと・・・？ - 共通プラットフォーム的な構想が必要だが、一足飛びにそれは無理 - 開発リソースがそんなにあるわけでもないし、現時点でハマるかは不明 - そもそもユースケースも無数すぎていきなりはハードルが高すぎる

Slide 17

Slide 17 text

全体的な方向性データオーナーとコラボして適切な運用ができるようにする - DRE、オーナーどちらかに運用負荷がよらずにお互いの職責として適切な範囲になるようにする変更に強い状態にする - データソース側の変更があっても容易に壊れない状態にする - できるだけ将来的な自動化やリソースの共通化を目指せる状態にしておく大事なユースケースを把握できる状態にする - ユースケースを定期的に棚卸しし、必要な業務をすぐに把握できる状態 - 一定の品質モニタリングはセットで提供する

Slide 18

Slide 18 text

やっていきたいことデータソース処理 BQ (Staging) まずはこのレベルをデータプロダクトとして捉え、ガバナンス担保可能にしたい利用者 Contract Contract

Slide 19

Slide 19 text

事例. 社内スプシの収集業務スプシとの格闘の歴史 - sandbox環境を用意して、そこにユーザで繋ぎ込んでもらう - 秩序が保てない(個人情報、いらないデータが残り続ける) - 期限付きにしたら、本番系ユースケースでアナリストの工数増大 - DREが外部テーブルとして繋ぎ込んでいた - 何を約束しても変更が入るときは入っちゃうのでパイプライン的に守れない - DREの工数増大（ユースケースごとでスケールしにくい） - データ収集用途のサムシング検討 - AppSheetは運用面の負が大きくなり撤退 - nocodb検証中も微妙にハマらない

Slide 20

Slide 20 text

コントラクト駆動の実装 Output Port スプシデータ収集用 Data Product Input Port raw data (lake) staging data スプシのコントラクト BQ上のコントラクト DRE 実装データオーナー

Slide 21

Slide 21 text

DataContractの実装フォーマット引用元：[Data Contract Specification](https://datacontract.com/) datacontract specification dataproduct specification 引用元：[Data Product Specification](https://dataproduct-specification.com/)

Slide 22

Slide 22 text

参考) Data Mesh Manager 引用元：[Data Mesh Manager公式サイト](https://www.datamesh-manager.com/)

Slide 23

Slide 23 text

責務の整理データオーナー DRE - データの場所 - 中身の情報 - 品質情報 - 後続のユースケース … データコントラクトを介した合意

Slide 24

Slide 24 text

変更への耐性スプシ(ソース)のコントラクト BQ上のコントラクト dataContractSpecification: 0.9.3 id: hogehoge_source servers: production: type: spreadsheet location: https://spreadsheetのdrive header_row: 1 models: source: type: table fields: "データ取得日": type: string required: false description: データ取得日 "日付": type: string required: false description: 仕事開始日 … dataContractSpecification: 0.9.3 id: hogehoge_staging servers: production: type: bigquery models: staging: type: table fields: "obtained_date": type: datetime required: false description: データ取得日 config: mapping: data_contract_id: competitor_information/hallo_source field_name: データ取得日 "started_date": type: datetime required: false description: 仕事開始日 config: mapping: data_contract_id: competitor_information/hallo_source field_name: 日付 … シンプルな一対一変換なのでこの形式データオーナーにコントラクトの運用を握ってもらい、それに従い処理をある程度機械的に生成できるように ※ 抜粋です

Slide 25

Slide 25 text

変更への耐性処理上の工夫 raw data (lake) staging data jsonlに変換 SQL jsonをparseしながらSELECT => stagingの定義が変わってもrawからの読み込み直しで済む

Slide 26

Slide 26 text

ユースケースの収集・整理現状の実装と課題感引用元：[Timee Product Team Blog](https://tech.timee.co.jp/entry/2024/03/18/110548) 課題感 - クリティカルなユースケースが判別できないいいところ - 影響を及ぼす可能性がある場所は理論上全て把握できる

Slide 27

Slide 27 text

ユースケースの収集・整理こうしていきたい(願望)の話 Output Port スプシデータ収集用 Data Product Input Port raw data (lake) staging data めっちゃクリティカルな利用 DataProduct Input Port 会社の存続に関わる利用 DataProduct Input Port

Slide 28

Slide 28 text

サービスレベルの明示・改善 dataContractSpeciﬁcation: 0.9.3 id: hogehoge_source servers: production: type: spreadsheet location: https://spreadsheetのdrive header_row: 1 … servicelevels: availability: description: | 可用性。データに参照できる割合。 BigQueryのUptimeに準じる https://cloud.google.com/bigquery/sla?hl=ja percentage: 99.9% retention: description: データの保持期間。無制限に保持する。 unlimited: true latency: description: データが書き込まれてから利用可能になるまでの時間 threshold: 1d sourceTimestampField: obtained_date frequency: description: データの更新頻度 type: batch interval: 24h cron: 0 17 * * * # 深夜帯の想定 ● ドキュメントとして再整備し、データオーナーと合意 ● ユースケースの再チェックしつつ再定義

Slide 29

Slide 29 text

その他これからのこと - SLOモニタリング、可視化 - Staging以降の定義とその運用検討 - データインシデントの可視化 - 横転・自動化 - プロダクトのDBへの適用

Slide 30

Slide 30 text

3 まとめ

Slide 31

Slide 31 text

まとめ - 当たり前だが、世の中のプラクティスがそのまま適用可能なほど現実は甘くないので組織の状態を見ながら試行錯誤が大事 - データエンジニアだけで全域を抑えるのはほぼ不可能なので、ビジネスユーザと分担しながら整備していくと本質的な改善が回る (機運を感じている)

Slide 32

Slide 32 text

いっしょにデータ品質を改善していきましょう！！ https://hrmos.co/pages/timee/jobs/1682251404118319115 We're hiring!