Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
COMETA®開発の裏側をご紹介
Search
Manami Nakamura
October 11, 2024
Programming
0
920
COMETA®開発の裏側をご紹介
Data Engineering Study #25 データカタログの現在地 にてお話しした内容です。
https://forkwell.connpass.com/event/328066/
Manami Nakamura
October 11, 2024
Tweet
Share
More Decks by Manami Nakamura
See All by Manami Nakamura
TROCCOで開発生産性を計測してみた
mnmandahalf
0
87
データカタログのアクセスコントロールを考える
mnmandahalf
0
35
primeNumberでのRBS導入の現在 && RBS::Traceでinline RBSを拡充してみた
mnmandahalf
0
510
Railsのマイグレーション、どこまで安全にできるか
mnmandahalf
0
45
よく考えずにRDSを暗号化したら辛かった話
mnmandahalf
0
22
Other Decks in Programming
See All in Programming
CSC509 Lecture 03
javiergs
PRO
0
340
After go func(): Goroutines Through a Beginner’s Eye
97vaibhav
0
390
Claude CodeによるAI駆動開発の実践 〜そこから見えてきたこれからのプログラミング〜
iriikeita
0
250
CSC305 Lecture 08
javiergs
PRO
0
200
大規模アプリのDIフレームワーク刷新戦略 ~過去最大規模の並行開発を止めずにアプリ全体に導入するまで~
mot_techtalk
1
450
Serena MCPのすすめ
wadakatu
4
1k
作って理解するGOCACHEPROG / Go Conference 2025(Workshop)
mazrean
0
100
All About Angular's New Signal Forms
manfredsteyer
PRO
0
160
その面倒な作業、「Dart」にやらせませんか? Flutter開発者のための業務効率化
yordgenome03
1
130
そのpreloadは必要?見過ごされたpreloadが技術的負債として爆発した日
mugitti9
2
3.4k
CSC509 Lecture 05
javiergs
PRO
0
300
はじめてのDSPy - 言語モデルを『プロンプト』ではなく『プログラミング』するための仕組み
masahiro_nishimi
2
490
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Side Projects
sachag
455
43k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Scaling GitHub
holman
463
140k
Fireside Chat
paigeccino
40
3.7k
Code Review Best Practice
trishagee
72
19k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
31
2.7k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Rails Girls Zürich Keynote
gr2m
95
14k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
8
910
Transcript
primeNumber Inc. © COMETA®開発の裏側をご紹介 2024.08 primeNumber Inc.
© primeNumber Inc. 2 中村愛美 株式会社primeNumber COMETAチーム Senior Manager X:
@mnmandahalf WHO AM I? 2015年にエンジニアとしてキャリアをスタート し、 toB向け基幹業務システム開発、toC向け Webアプリケーション開発、クラウドインフラ構 築、EM等を経験してきました。 2023年6月にprimeNumberに入社し、COMETA® 立ち上げ期の開発リードを担当。2024年5月より 発足したCOMETAチームEM。
INDEX © primeNumber Inc. 3 • COMETA®の概要 • エンジニア視点でご紹介するCOMETA®の特色 •
直近のリリースと今後について
© primeNumber Inc. 4 COMETA®の概要
© primeNumber Inc. 5 COMETA®とは • データの発見・理解・活用を促進するデータカタログSaaS • 散らばったデータを管理し、安全かつ効率的にデータを利用可能に します。
• 機能例 ◦ メタデータ検索 ◦ カラムリネージ ◦ クエリエディタ ◦ ER図 ◦ JOIN分析 ◦ 用語集
© primeNumber Inc. 6 COMETA®の構成要素 • ユーザーがメタデータを閲覧・登録するUI • メタデータを取り込むバッチ ◦
DWHのメタデータ取り込み ◦ TROCCO®で転送しているメタデータの自動生成 ◦ 検索インデックス生成 ◦ リネージ生成
© primeNumber Inc. 7 構成図 ※ 2024/08時点
© primeNumber Inc. 8 COMETA®の特色 エンジニア視点でご紹介する
© primeNumber Inc. 9 カラムレベルリネージ COMETAの特色 ①
© primeNumber Inc. 10 カラムレベルリネージ • BigQuery、Snowflakeともに、SQLパーサのライブラリを拡張して実装 • ASTを読み解く地道な作業の上に実現されている機能
© primeNumber Inc. 11 カラムレベルリネージ • 現在はTROCCO®データマート機能を利用の場合のみ対応 • SQLさえあればよいのでビューのリネージやdbtのビルド結果のSQLを 用いたカラムレベルリネージも今後拡充を予定
© primeNumber Inc. 12 ER図・JOIN分析機能 COMETAの特色 ②
© primeNumber Inc. 13 ER図 • リレーションを定義すると以下のような図をリアルタイムで表示可能 • 論理的なテーブル同士の関連を俯瞰できる •
分析者は、このテーブルに関連するテーブルは?という探し方ができる
© primeNumber Inc. 14 ER図 • リレーションのデータは現在3種類の生成方法に対応 ◦ 手動でカラム同士の関連をUIから登録 ◦
TROCCO®で転送している場合は、転送元のMySQLやPostgreSQLの 外部キー情報を取得して自動生成 ◦ カラム同士の関連をCSVに記載して一括インポート(new!) • クエリエディタでON句を記載した時の補完にも活用されます
© primeNumber Inc. 15 JOIN分析 • ER図のエッジをクリックすることで特定キーでJOINした結果が 視覚的に分析でき、適切な結合方法がわかる
© primeNumber Inc. 16 日本語検索対応 COMETAの特色 ③
© primeNumber Inc. 17 日本語検索対応 • Elasticsearchのプラグインで日本語あいまい検索を実現している ◦ (例)売り上げ /
売上 • 項目ごとに部分一致、kuromoji analyzer、n-gram等を使い分け • ユーザー辞書への対応など、まだまだカスタマイズの余地あり
© primeNumber Inc. 18 その他 • クエリエディタ(補完あり) • データプレビュー機能 なども特徴的ですが、時間の関係で割愛します😢
© primeNumber Inc. 19 直近のリリースと今後について
© primeNumber Inc. 20 直近3ヶ月のリリース • メタデータの登録状況や推移が確認できるダッシュボード機能 • 大量テーブルのメタデータ取り込みと画面のパフォーマンスチューニング •
用語集機能 • メタデータCSVエクスポート • ユーザー管理画面改善 • ERDの動線改善 • Snowflake日本語テーブル対応 • Tableau連携 • etc… 毎月大きめの機能リリースをコンスタントに行っています!
© primeNumber Inc. 21 今後について • 直近はdbt連携、DWHから取得するメタデータ強化、コネクタなしでデー タベースを追加する仕組みの追加等を予定 • 皆様の「こんな機能があったらいいな」の声をお待ちしています!
© primeNumber Inc. 22 We are hiring! • データカタログSaaSの開発に興味がある仲間も募集中です! •
PdM、デザイナ、CS、セールス一丸となり上流の要件/仕様策定から 携わることができます。 • エンジニアリングファーストな社風で、価値を生み出せる人が尊重され、 裁量を持てる文化です。 • 数少ない国産プロダクトとして、お客様と一緒に市場を成長させていく 楽しさがあります。 https://recruit.primenumber.co.jp/
Thank you!