Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
COMETA®開発の裏側をご紹介
Search
Manami Nakamura
October 11, 2024
Programming
0
930
COMETA®開発の裏側をご紹介
Data Engineering Study #25 データカタログの現在地 にてお話しした内容です。
https://forkwell.connpass.com/event/328066/
Manami Nakamura
October 11, 2024
Tweet
Share
More Decks by Manami Nakamura
See All by Manami Nakamura
TROCCOで開発生産性を計測してみた
mnmandahalf
0
95
データカタログのアクセスコントロールを考える
mnmandahalf
0
35
primeNumberでのRBS導入の現在 && RBS::Traceでinline RBSを拡充してみた
mnmandahalf
0
530
Railsのマイグレーション、どこまで安全にできるか
mnmandahalf
0
51
よく考えずにRDSを暗号化したら辛かった話
mnmandahalf
0
22
Other Decks in Programming
See All in Programming
組織もソフトウェアも難しく考えない、もっとシンプルな考え方で設計する #phpconfuk
o0h
PRO
5
1.4k
マイベストのシンプルなデータ基盤の話 - Googleスイートとのつき合い方 / mybest-simple-data-architecture-google-nized
snhryt
0
130
TransformerからMCPまで(現代AIを理解するための羅針盤)
mickey_kubo
7
6k
問題の見方を変える「システム思考」超入門
panda_program
0
130
Verilator + Rust + gRPC と Efinix の RISC-V でAIアクセラレータをAIで作ってる話 RTLを語る会(18) 2025/11/08
ryuz88
0
260
CSC305 Lecture 12
javiergs
PRO
0
250
HTTPじゃ遅すぎる! SwitchBotを自作ハブで動かして学ぶBLE通信
occhi
0
200
CSC509 Lecture 10
javiergs
PRO
0
170
AIと人間の共創開発!OSSで試行錯誤した開発スタイル
mae616
2
880
Blazing Fast UI Development with Compose Hot Reload (Bangladesh KUG, October 2025)
zsmb
2
460
Eloquentを使ってどこまでコードの治安を保てるのか?を新人が考察してみた
itokoh0405
0
2.8k
開発組織の戦略的な役割と 設計スキル向上の効果
masuda220
PRO
10
2.1k
Featured
See All Featured
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.3k
Typedesign – Prime Four
hannesfritz
42
2.9k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
950
A Modern Web Designer's Workflow
chriscoyier
697
190k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.5k
Scaling GitHub
holman
463
140k
How to Think Like a Performance Engineer
csswizardry
27
2.2k
Statistics for Hackers
jakevdp
799
220k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.2k
Designing for humans not robots
tammielis
254
26k
Rebuilding a faster, lazier Slack
samanthasiow
84
9.2k
GraphQLとの向き合い方2022年版
quramy
49
14k
Transcript
primeNumber Inc. © COMETA®開発の裏側をご紹介 2024.08 primeNumber Inc.
© primeNumber Inc. 2 中村愛美 株式会社primeNumber COMETAチーム Senior Manager X:
@mnmandahalf WHO AM I? 2015年にエンジニアとしてキャリアをスタート し、 toB向け基幹業務システム開発、toC向け Webアプリケーション開発、クラウドインフラ構 築、EM等を経験してきました。 2023年6月にprimeNumberに入社し、COMETA® 立ち上げ期の開発リードを担当。2024年5月より 発足したCOMETAチームEM。
INDEX © primeNumber Inc. 3 • COMETA®の概要 • エンジニア視点でご紹介するCOMETA®の特色 •
直近のリリースと今後について
© primeNumber Inc. 4 COMETA®の概要
© primeNumber Inc. 5 COMETA®とは • データの発見・理解・活用を促進するデータカタログSaaS • 散らばったデータを管理し、安全かつ効率的にデータを利用可能に します。
• 機能例 ◦ メタデータ検索 ◦ カラムリネージ ◦ クエリエディタ ◦ ER図 ◦ JOIN分析 ◦ 用語集
© primeNumber Inc. 6 COMETA®の構成要素 • ユーザーがメタデータを閲覧・登録するUI • メタデータを取り込むバッチ ◦
DWHのメタデータ取り込み ◦ TROCCO®で転送しているメタデータの自動生成 ◦ 検索インデックス生成 ◦ リネージ生成
© primeNumber Inc. 7 構成図 ※ 2024/08時点
© primeNumber Inc. 8 COMETA®の特色 エンジニア視点でご紹介する
© primeNumber Inc. 9 カラムレベルリネージ COMETAの特色 ①
© primeNumber Inc. 10 カラムレベルリネージ • BigQuery、Snowflakeともに、SQLパーサのライブラリを拡張して実装 • ASTを読み解く地道な作業の上に実現されている機能
© primeNumber Inc. 11 カラムレベルリネージ • 現在はTROCCO®データマート機能を利用の場合のみ対応 • SQLさえあればよいのでビューのリネージやdbtのビルド結果のSQLを 用いたカラムレベルリネージも今後拡充を予定
© primeNumber Inc. 12 ER図・JOIN分析機能 COMETAの特色 ②
© primeNumber Inc. 13 ER図 • リレーションを定義すると以下のような図をリアルタイムで表示可能 • 論理的なテーブル同士の関連を俯瞰できる •
分析者は、このテーブルに関連するテーブルは?という探し方ができる
© primeNumber Inc. 14 ER図 • リレーションのデータは現在3種類の生成方法に対応 ◦ 手動でカラム同士の関連をUIから登録 ◦
TROCCO®で転送している場合は、転送元のMySQLやPostgreSQLの 外部キー情報を取得して自動生成 ◦ カラム同士の関連をCSVに記載して一括インポート(new!) • クエリエディタでON句を記載した時の補完にも活用されます
© primeNumber Inc. 15 JOIN分析 • ER図のエッジをクリックすることで特定キーでJOINした結果が 視覚的に分析でき、適切な結合方法がわかる
© primeNumber Inc. 16 日本語検索対応 COMETAの特色 ③
© primeNumber Inc. 17 日本語検索対応 • Elasticsearchのプラグインで日本語あいまい検索を実現している ◦ (例)売り上げ /
売上 • 項目ごとに部分一致、kuromoji analyzer、n-gram等を使い分け • ユーザー辞書への対応など、まだまだカスタマイズの余地あり
© primeNumber Inc. 18 その他 • クエリエディタ(補完あり) • データプレビュー機能 なども特徴的ですが、時間の関係で割愛します😢
© primeNumber Inc. 19 直近のリリースと今後について
© primeNumber Inc. 20 直近3ヶ月のリリース • メタデータの登録状況や推移が確認できるダッシュボード機能 • 大量テーブルのメタデータ取り込みと画面のパフォーマンスチューニング •
用語集機能 • メタデータCSVエクスポート • ユーザー管理画面改善 • ERDの動線改善 • Snowflake日本語テーブル対応 • Tableau連携 • etc… 毎月大きめの機能リリースをコンスタントに行っています!
© primeNumber Inc. 21 今後について • 直近はdbt連携、DWHから取得するメタデータ強化、コネクタなしでデー タベースを追加する仕組みの追加等を予定 • 皆様の「こんな機能があったらいいな」の声をお待ちしています!
© primeNumber Inc. 22 We are hiring! • データカタログSaaSの開発に興味がある仲間も募集中です! •
PdM、デザイナ、CS、セールス一丸となり上流の要件/仕様策定から 携わることができます。 • エンジニアリングファーストな社風で、価値を生み出せる人が尊重され、 裁量を持てる文化です。 • 数少ない国産プロダクトとして、お客様と一緒に市場を成長させていく 楽しさがあります。 https://recruit.primenumber.co.jp/
Thank you!