Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
マルチデータプロダクトの開発を支えるデータの民主化の仕組み
Search
Kosaku Ono
September 25, 2025
Technology
1
310
マルチデータプロダクトの開発を支えるデータの民主化の仕組み
NIKKEI Tech Talk #37
マルチデータプロダクトの開発を支えるデータの民主化の仕組み
https://nikkei.connpass.com/event/364257/
Kosaku Ono
September 25, 2025
Tweet
Share
More Decks by Kosaku Ono
See All by Kosaku Ono
Snowflake Intelligence × Document AIで“使いにくいデータ”を“使えるデータ”に
kevinrobot34
1
540
情報セキュリティ入門
kevinrobot34
0
160
Snowflakeデータ基盤の複数環境構成
kevinrobot34
1
510
マルチデータプロダクト基盤としての Snowflake の権限管理とコスト管理
kevinrobot34
3
3.3k
Apache Iceberg The Definitive Guide 輪読会 - 4章前半
kevinrobot34
1
790
Snowflake 第1回 金融ユーザー会
kevinrobot34
1
420
Snowflake x dbt x Terraform マルチデータプロダクト基盤 [DataOps Night #4]
kevinrobot34
1
2.4k
Apache Iceberg The Definitive Guide 輪読会 - 1章後半
kevinrobot34
1
810
認証認可の基礎からはじめる AWS IAM 徹底入門
kevinrobot34
1
800
Other Decks in Technology
See All in Technology
Jakarta Agentic AI Specification - Status and Future
reza_rahman
0
120
今年のデータ・ML系アップデートと気になるアプデのご紹介
nayuts
1
580
re:Invent 2025 ~何をする者であり、どこへいくのか~
tetutetu214
0
230
【U/Day Tokyo 2025】Cygames流 最新スマートフォンゲームの技術設計 〜『Shadowverse: Worlds Beyond』におけるアーキテクチャ再設計の挑戦~
cygames
PRO
2
950
100以上の新規コネクタ提供を可能にしたアーキテクチャ
ooyukioo
0
150
AI駆動開発における設計思想 認知負荷を下げるフロントエンドアーキテクチャ/ 20251211 Teppei Hanai
shift_evolve
PRO
2
440
障害対応訓練、その前に
coconala_engineer
0
140
日本Rubyの会: これまでとこれから
snoozer05
PRO
4
200
マイクロサービスへの5年間 ぶっちゃけ何をしてどうなったか
joker1007
17
7.1k
AlmaLinux + KVM + Cockpit で始めるお手軽仮想化基盤 ~ 開発環境などでの利用を想定して ~
koedoyoshida
0
120
通勤手当申請チェックエージェント開発のリアル
whisaiyo
3
260
.NET 10の概要
tomokusaba
0
120
Featured
See All Featured
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
1
120
Typedesign – Prime Four
hannesfritz
42
2.9k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.6k
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
170
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
130
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
0
67
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
0
240
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
110
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
39
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
Transcript
© 2024 Finatext Holdings Ltd. マルチデータプロダクトの開発を 支えるデータの民主化の仕組み 2025/09/25 株式会社ナウキャスト 大野巧作
/ @Kevinrobot34 NIKKEI Tech Talk #37
© 2024 Finatext Holdings Ltd. アジェンダ 1. イントロダクション 2. ナウキャストのデータ基盤
3. ナウキャストにおけるデータの民主化 4. 今後の課題 1
© 2024 Finatext Holdings Ltd. 1. イントロダクション 自己紹介 • 名前:大野巧作
◦ 大体けびんと呼ばれています ◦ X / GitHub / Zenn / SpeakerDeck などは @Kevinrobot34 • 役職:Data Engineer / Data Platform Engineer @ Nowcast ◦ 2020年新卒入社 ◦ POSデータのパイプライン作成・運用、分析 ◦ Snowflake x dbt x Terraform な社内データ基盤構築・運用 2
© 2024 Finatext Holdings Ltd. 1. イントロダクション 会社紹介 データの保有側・利用側の双方に価値を提供するオルタナティブデータの Two-Sided
Platformを展開します 3
© 2024 Finatext Holdings Ltd. 1. イントロダクション NowcastがSnowflakeで扱う多様なデータ 4 決済データ
(POS、クレジットカード) マスタデータ (住所、企業、商業施設) 人流データ (位置情報) 労働市場データ (求人情報) 広告データ (TV広告) 財務データ (決算・有価証券報告書) これらの様々なデータを迅速に加工・分析していくために、 セルフサービスなデータ基盤が必須だった
© 2024 Finatext Holdings Ltd. 2. ナウキャストのデータ基盤 ナウキャストのデータ基盤 Datahub 一つの
Snowflake アカウントの中で様々なデータの ELT パイプライン (dbt) が動いている。 インフラは Terraform で管理されており、Airflow でタスクのオーケストレーションをしている。 5
© 2024 Finatext Holdings Ltd. 2. ナウキャストのデータ基盤 ナウキャストのデータ基盤 Datahub このようなデータ基盤に至る経緯や、最近の非構造化データの活用などについては以下の資料もご覧ください。
6 Snowflake x dbt x Terraform マルチデータプロダクト基盤 DataOps Night #4 資料 Snowflake Intelligence × Document AI で “使いにくいデータ”を“使えるデータ”に Snowflake World Tour Tokyo 2025 資料
© 2024 Finatext Holdings Ltd. 2. ナウキャストのデータ基盤 データ基盤の利用状況 7 100TB+
データ保存量 30+ データソース数 20TB+ データスキャン量 / 日 100+ 社内ユーザー数 200K+ クエリ数 / 日 70%+ アクティブ率
© 2024 Finatext Holdings Ltd. 3. ナウキャストにおけるデータの民主化 データの民主化の施策 8 組織構造
Platform Team と Stream Aligned Team による 役割分担 CI/CD等の整備 適切なCI/CDの整備、 そして GitHub の環境の整備により 開発体験を向上 横展開を見据えた設計 モジュール化・テンプレート化を 適切に行い、開発を迅速にし 知見も展開しやすく 知見共有の文化づくり 仕組みで横展開しやすくするだけでなく 知見を共有する文化を作り 社内での開発の効率向上を目指す
© 2024 Finatext Holdings Ltd. 3. ナウキャストにおけるデータの民主化 組織構造 Platform Team
と Stream Aligned Team • Platform Team ◦ データ基盤の設計・構築・運用やCCoE的な役割 ◦ 中央集権型になるとスケールできないので、 セルフサービスなデータ基盤となるように設計 ◦ 具体例(後述) ▪ Snowflake や dbt の モジュール・テンプレートの開発 ▪ CI/CDの整備 ▪ 知見の共有の文化づくり • Stream Aligned Team ◦ 各データソース・データプロダクトに 関する開発・保守に注力 9
© 2024 Finatext Holdings Ltd. 3. ナウキャストにおけるデータの民主化 横展開を見据えた設計 • 各チームがよく使うインフラについては
Terraform でモジュールを作り、 それを利用すれば以下のアーキテクチャがサクッと作れるような形に。 • dbt や Python 環境、Dockerfile などもまとめて作れるテンプレートも。 • これらのモジュールやテンプレートは社内だけでなく、 ソリューション事業でも同様なものが使えるようになっている ◦ SnowCast としてリリース ◦ 社内外の活用を踏まえ、日々改善が行われている 10
© 2024 Finatext Holdings Ltd. 3. ナウキャストにおけるデータの民主化 CI/CDの整備 • GitHub
Repo の整備 ◦ なるべくブランチ戦略は GitHub flow などシンプルに ▪ masterブランチ一本であれば誰でも気軽に作業しやすいように ◦ branch rule set を適切に入れて、ミスがないように ▪ master branch の保護 ▪ CIの強制 ▪ CODEOWNERSによる特定ファイル・フォルダの保護 ▪ merge 方法の指定(squashのみにするなど) ◦ 全社的な仕組み ▪ Secrets Scan の仕組みで間違って API キーなどをコミットしても気付けるように 11 Efficient Platform for Security and Compliance https://speakerdeck.com/taiki45/efficient-platf orm-for-security-and-compliance-89d1ad22-14 d6-44df-ab7e-dc4ca7fb470c
© 2024 Finatext Holdings Ltd. 3. ナウキャストにおけるデータの民主化 CI/CDの整備 • CI/CDの対象
◦ Terraform ◦ dbt や Python コード ▪ SQLやPython の Linter / Formatter ▪ Image を ECR に push ◦ Airflow の dag のデプロイ ◦ Streamlit 12
© 2024 Finatext Holdings Ltd. 3. ナウキャストにおけるデータの民主化 知見共有の文化づくり • 各プロダクトで見つけた課題や知見を共有するようにしている
• 課題についてはなるべく早めに現象を解明し、CIやモジュールに反映することで仕組みで解決しそれを展開 • パフォーマンス改善などの知見については気軽に共有できる勉強会を週次で開催 ◦ また内容によってはそれをまとめてテックブログにも 13 ナウキャスト含むFinatextグループのZenn : https://zenn.dev/p/finatext
© 2024 Finatext Holdings Ltd. 4. 今後の課題 更なるセルフサービス化 • 権限管理を適切に行うために、多くのロールが作られている
◦ Terraform Module で作成しているので、 一定のルールで作られてはいるものの、 数が多くなってきているため管理が大変 ◦ またこの Snowflake アカウントの強めの権限を 渡すわけにはいかない • より data mesh 的なアプローチも検討し得る ◦ プロダクトなどごとに Snowflake アカウントを分け、社内で共有するためには Snowflake の Internal Marketplace を利用して データを共有 ◦ また Iceberg を使うことで、 Snowflake 外でもデータ提供しやすい 14 https://medium.com/snowflake/how-snowflake-powers-data-mesh-arc hitecture-with-an-internal-marketplace-6f2368ae0d8d より
© 2024 Finatext Holdings Ltd. 4. 今後の課題 更なるデータ基盤の進化 • メタデータ管理の高度化
◦ OpenMetadata など、メタデータ管理をよりやりやすくしていく ◦ エンジニア・ビジネスメンバー・AIそれぞれ皆が使いやすいメタデータ管理方法の模索 • 非構造化データの更なる活用 ◦ データ抽出の自動化と Human-in-the-loop による精度の担保 ◦ テキストデータも含めた活用 15 Snowflake Intelligence × Document AI で “使いにくいデータ”を“使えるデータ”に Snowflake World Tour Tokyo 2025 資料
© 2024 Finatext Holdings Ltd. 今日のまとめ • ナウキャストではマルチデータプロダクトの開発を迅速に行うために、 セルフサービスなデータ基盤を構築し、運用している ◦
組織構造 ◦ モジュール化・テンプレート化による横展開 ◦ CI/CD の整備 ◦ 知見共有の文化づくり • 更なるセルフサービス化やメタデータ管理、 非構造データの活用など、データ基盤の進化の余地はまだまだある • 一緒にデータの民主化を進め、 データプロダクトを作っていくメンバー募集中! ◦ データエンジニア ◦ アナリティクスエンジニア ◦ サーバーサイドエンジニア ◦ など幅広く募集中です! 16 Finatext グループ採用サイト https://finatext.com/recruit
None