Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スタートアップにおけるこれからの「データ整備」
Search
ShoMaekawa/ウィル
October 09, 2025
Technology
2
590
スタートアップにおけるこれからの「データ整備」
ShoMaekawa/ウィル
October 09, 2025
Tweet
Share
More Decks by ShoMaekawa/ウィル
See All by ShoMaekawa/ウィル
2025-03-25Communeデータの魅力&仕事の魅力
shomaekawa
0
370
解説!データ基盤の進化を後押しする手順とタイミング
shomaekawa
1
480
属人化からデータマネジメントをチームで実行するまでの道のり
shomaekawa
2
580
SaaSスタートアップにおけるデータマネジメントの始め方
shomaekawa
2
970
フルスタック一人目データアナリストがデータ基盤を作ったお話
shomaekawa
1
1.1k
BtoBSaaSCS-LightningTalks_CS_Ops立ち上げのアンチパターン5撰
shomaekawa
2
910
オープンエイトの CS Ops事例〜データで顧客を見える化し CS業務を強化する〜
shomaekawa
0
1.4k
Googleデータポータル徹底解剖
shomaekawa
1
260
データ活用する人のための論点整理トレーニング
shomaekawa
1
2.3k
Other Decks in Technology
See All in Technology
kotlin-lsp の開発開始に触発されて、Emacs で Kotlin 開発に挑戦した記録 / kotlin‑lsp as a Catalyst: My Journey to Kotlin Development in Emacs
nabeo
2
380
Kotlinで型安全にバイテンポラルデータを扱いたい! ReladomoラッパーをAIと実装してみた話
itohiro73
3
300
エンジニアにとってコードと並んで重要な「データ」のお話 - データが動くとコードが見える:関数型=データフロー入門
ismk
0
120
どうなる Remix 3
tanakahisateru
1
300
AWS 環境で GitLab Self-managed を試してみた/aws-gitlab-self-managed
emiki
0
310
コード1ミリもわからないけど Claude CodeでFigjamプラグインを作った話
abokadotyann
1
130
これからアウトプットする人たちへ - アウトプットを支える技術 / that support output
soudai
PRO
12
4.1k
最近読んで良かった本 / Yokohama North Meetup #10
mktakuya
0
1.3k
ソフトウェア品質を支える テストとレビュー再考 / 吉澤 智美さん
findy_eventslides
1
850
AIエージェントを導入する [ 社内ナレッジ活用編 ] / Implement AI agents
glidenote
1
300
こんな時代だからこそ! 想定しておきたいアクセスキー漏洩後のムーブ
takuyay0ne
4
410
Data Engineering Guide 2025 #data_summit_findy by @Kazaneya_PR / 20251106
kazaneya
PRO
10
1.9k
Featured
See All Featured
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
650
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.7k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8k
Building an army of robots
kneath
306
46k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.5k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.2k
Docker and Python
trallard
46
3.6k
Statistics for Hackers
jakevdp
799
220k
Transcript
© Commune Inc. All rights reserved 1 スタートアップにおけるこれからの「データ整備」 Commune Inc.
Data Manager Sho Maekawa 2025/10/08
© Commune Inc. All rights reserved ⾃⼰紹介 Sho Maekawa (X:
@ willanalysts) 2 Communeのデータチームマネージャー。 ex-オープンエイト、ヤフー • 2023年6⽉にコミューンへ⼊社 • Product & Dataチームに所属 ◦ 10名くらいデータ専任が在籍しており、さ らに採⽤中〜 • データ分析エージェントを中⼼に捉えたデータ整 備が最近のメインミッションです。 • 札幌からリモートワークで働いています!
© Commune Inc. All rights reserved 3 Communeの
© Commune Inc. All rights reserved はじめに 4 スタートアップのデータ整備に、ようやく光が⾒えてきた! これまで、スタートアップにおけるデータ整備は「終わりの⾒えない戦い」でした。採⽤を頑張り、コツコ
ツと基盤を作り続けても、活⽤成果が現れるまでのリードタイムと不確実性が⾼かったと思います。データ チームは常にアドホックな依頼に追われ、根本的な改善に着⼿する余裕もない。多くのデータ⼈材が、この 状況に疲弊してきたのではないでしょうか。 2〜3⼈の精鋭チームが分析エージェントを中⼼に、ヒューマン‧イン‧ザ‧ループでデータ整備を回すこ とで、「将来、楽にデータ活⽤できる状態」を実現できるのではないか、と。
© Commune Inc. All rights reserved 分析エージェント:Community Sage 5 ‧チャット形式の分析エージェント
‧チャットシェア機能 ‧SQLコード表⽰機能 ‧グラフ作成サブエージェント ‧Slackバージョンの提供 etc 年内別のデータイベントで開発者のデータサイエンティストが詳しく発表予定
© Commune Inc. All rights reserved コミューンのデータ整備:Community Sageの精度向上に全ベットしていく 6 ヒューマンインザループな改善サイクルを回しています
問い合わせ 振り返り 精度改善 エージェント改善 データモデリング メトリクス辞書 etc データチームへの 問い合わせ
© Commune Inc. All rights reserved コミューンのデータ整備:AIアプリとダッシュボード開発の棲み分け 7 コミューンではデータラボというお客様にデータを活⽤した実験的な機能をクイック にリリースする環境があります。⽬的特化型のダッシュボードやAIアプリを提供して
います。
© Commune Inc. All rights reserved コミューンのデータ整備:AIアプリとダッシュボード開発の棲み分け 8 個別の集計条件 ⽰唆付きの情報
お客様のニーズをヒアリングし、どのお客様にも刺さる王道パターンか個別要件なの かを⾒極めて提供しています。 王道頻出の可視化 指標を並べて探索 使い分け⽅ 個別パターンに対応しなくて良くな りメンテしやすくなる 頻出の情報を何度もクエリしなく て良いのでコスト節約 使い分けのメリット
© Commune Inc. All rights reserved コミューンのデータ整備:BI as Codeなダッシュボード開発 9
コミューンではThoughtspotというBIツールを活⽤しています。ThoughtSpot Modeling Languageで各種オブジェクトをコードベースで管理しています。 ‧dashboardのHELPドキュメントの⾃動⽣成 ‧filterの登録漏れや差分検証 ‧ThoughtSpot側のmetric計算ロジックを抽出理解すること BI as Codeとは従来のようなGUI操作による直感的な操作によるダッシュボード開発ではなく、コードに基づきダッ シュボードを管理運用すること
© Commune Inc. All rights reserved 3~5年未来の「データ整備」: データ分析エージェントを育てられる⼈が1-2⼈いればデータ活⽤ができる世界 10 データ基盤〜データ集計までをエージェントで低コストに構築できるようになり、⼩さ
なスタートアップがデータ専任⼈材をたくさん雇わなくても標準的なデータ活⽤ができ るようになる。 多くのスタートアップや中⼩企業でデータ活⽤が⾏われるようになるかも?
© Commune Inc. All rights reserved 個⼈の⽬標:これから1年間データ整備に集中していきます! 11 ・暗黙知を共有知にすることを徹底し、どこまで仕事が楽になるのかを確かめたい。 ・最小のコストで実現できるデータ活用のあり方をベストプラクティスとしてまとめたい。
・自分たちは楽しくデータマネジメントやデータの民主化を探求し、 単純作業を切り出し新しい雇用を産んでいきたい。 そのために以下のような意識で業務の棚卸しをして行きます。 専門知識の不要な作業の再定義・ 分解 現状のデータ分析業務を洗い出し、 専門知識が不要なタスクを明確に 切り出す。 フレームワークとプロセスの整理 切り出したタスクをマニュアル化し、 AIor誰でも実行でき標準プロセスを 構築。 単純作業の切り出しと雇用創出 マニュアル化できた単純作業を切り 出し、例えば事務職の方の新しい雇 用を生むくらいまで標準化してみた い。
© Commune Inc. All rights reserved 12 3職種募集中(データサイエンティスト、デー タエンジニア、アナリティクスエンジニア) 10/170名ほどデータ⼈材がいて楽しいです!
興味ある⽅は私までDMください〜! @willanalysts
© Commune Inc. All rights reserved 13 実は今、北海道へのデータ⼈材の移住がプチ ブームです! 定期的にデータイベントを開催するので遊びに
来てください!美味しいお店⾏きましょう〜 @willanalysts
© Commune Inc. All rights reserved