Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
COMETA®開発の裏側をご紹介
Search
Manami Nakamura
October 11, 2024
Programming
0
970
COMETA®開発の裏側をご紹介
Data Engineering Study #25 データカタログの現在地 にてお話しした内容です。
https://forkwell.connpass.com/event/328066/
Manami Nakamura
October 11, 2024
Tweet
Share
More Decks by Manami Nakamura
See All by Manami Nakamura
TROCCOで開発生産性を計測してみた
mnmandahalf
0
110
データカタログのアクセスコントロールを考える
mnmandahalf
0
54
primeNumberでのRBS導入の現在 && RBS::Traceでinline RBSを拡充してみた
mnmandahalf
0
610
Railsのマイグレーション、どこまで安全にできるか
mnmandahalf
0
100
よく考えずにRDSを暗号化したら辛かった話
mnmandahalf
0
29
Other Decks in Programming
See All in Programming
へんな働き方
yusukebe
6
2.9k
仕様漏れ実装漏れをなくすトレーサビリティAI基盤のご紹介
orgachem
PRO
7
3.4k
我々はなぜ「層」を分けるのか〜「関心の分離」と「抽象化」で手に入れる変更に強いシンプルな設計〜 #phperkaigi / PHPerKaigi 2026
shogogg
2
700
Geminiをパートナーに神社DXシステムを個人開発した話(いなめぐDX 開発振り返り)
fujiba
0
120
車輪の再発明をしよう!PHP で実装して学ぶ、Web サーバーの仕組みと HTTP の正体
h1r0
2
440
メッセージングを利用して時間的結合を分離しよう #phperkaigi
kajitack
3
500
Redox OS でのネームスペース管理と chroot の実現
isanethen
0
480
Symfony + NelmioApiDocBundle を使った スキーマ駆動開発 / Schema Driven Development with NelmioApiDocBundle
okashoi
0
240
夢の無限スパゲッティ製造機 -実装篇- #phpstudy
o0h
PRO
0
170
Claude Code Skill入門
mayahoney
0
450
PHPで TLSのプロトコルを実装してみる
higaki_program
0
560
一度始めたらやめられない開発効率向上術 / Findy あなたのdotfilesを教えて!
k0kubun
3
2k
Featured
See All Featured
Designing for Performance
lara
611
70k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
260
30 Presentation Tips
portentint
PRO
1
260
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
220
Music & Morning Musume
bryan
47
7.1k
Raft: Consensus for Rubyists
vanstee
141
7.4k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
110
What does AI have to do with Human Rights?
axbom
PRO
1
2.1k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Automating Front-end Workflow
addyosmani
1370
200k
Tell your own story through comics
letsgokoyo
1
870
Transcript
primeNumber Inc. © COMETA®開発の裏側をご紹介 2024.08 primeNumber Inc.
© primeNumber Inc. 2 中村愛美 株式会社primeNumber COMETAチーム Senior Manager X:
@mnmandahalf WHO AM I? 2015年にエンジニアとしてキャリアをスタート し、 toB向け基幹業務システム開発、toC向け Webアプリケーション開発、クラウドインフラ構 築、EM等を経験してきました。 2023年6月にprimeNumberに入社し、COMETA® 立ち上げ期の開発リードを担当。2024年5月より 発足したCOMETAチームEM。
INDEX © primeNumber Inc. 3 • COMETA®の概要 • エンジニア視点でご紹介するCOMETA®の特色 •
直近のリリースと今後について
© primeNumber Inc. 4 COMETA®の概要
© primeNumber Inc. 5 COMETA®とは • データの発見・理解・活用を促進するデータカタログSaaS • 散らばったデータを管理し、安全かつ効率的にデータを利用可能に します。
• 機能例 ◦ メタデータ検索 ◦ カラムリネージ ◦ クエリエディタ ◦ ER図 ◦ JOIN分析 ◦ 用語集
© primeNumber Inc. 6 COMETA®の構成要素 • ユーザーがメタデータを閲覧・登録するUI • メタデータを取り込むバッチ ◦
DWHのメタデータ取り込み ◦ TROCCO®で転送しているメタデータの自動生成 ◦ 検索インデックス生成 ◦ リネージ生成
© primeNumber Inc. 7 構成図 ※ 2024/08時点
© primeNumber Inc. 8 COMETA®の特色 エンジニア視点でご紹介する
© primeNumber Inc. 9 カラムレベルリネージ COMETAの特色 ①
© primeNumber Inc. 10 カラムレベルリネージ • BigQuery、Snowflakeともに、SQLパーサのライブラリを拡張して実装 • ASTを読み解く地道な作業の上に実現されている機能
© primeNumber Inc. 11 カラムレベルリネージ • 現在はTROCCO®データマート機能を利用の場合のみ対応 • SQLさえあればよいのでビューのリネージやdbtのビルド結果のSQLを 用いたカラムレベルリネージも今後拡充を予定
© primeNumber Inc. 12 ER図・JOIN分析機能 COMETAの特色 ②
© primeNumber Inc. 13 ER図 • リレーションを定義すると以下のような図をリアルタイムで表示可能 • 論理的なテーブル同士の関連を俯瞰できる •
分析者は、このテーブルに関連するテーブルは?という探し方ができる
© primeNumber Inc. 14 ER図 • リレーションのデータは現在3種類の生成方法に対応 ◦ 手動でカラム同士の関連をUIから登録 ◦
TROCCO®で転送している場合は、転送元のMySQLやPostgreSQLの 外部キー情報を取得して自動生成 ◦ カラム同士の関連をCSVに記載して一括インポート(new!) • クエリエディタでON句を記載した時の補完にも活用されます
© primeNumber Inc. 15 JOIN分析 • ER図のエッジをクリックすることで特定キーでJOINした結果が 視覚的に分析でき、適切な結合方法がわかる
© primeNumber Inc. 16 日本語検索対応 COMETAの特色 ③
© primeNumber Inc. 17 日本語検索対応 • Elasticsearchのプラグインで日本語あいまい検索を実現している ◦ (例)売り上げ /
売上 • 項目ごとに部分一致、kuromoji analyzer、n-gram等を使い分け • ユーザー辞書への対応など、まだまだカスタマイズの余地あり
© primeNumber Inc. 18 その他 • クエリエディタ(補完あり) • データプレビュー機能 なども特徴的ですが、時間の関係で割愛します😢
© primeNumber Inc. 19 直近のリリースと今後について
© primeNumber Inc. 20 直近3ヶ月のリリース • メタデータの登録状況や推移が確認できるダッシュボード機能 • 大量テーブルのメタデータ取り込みと画面のパフォーマンスチューニング •
用語集機能 • メタデータCSVエクスポート • ユーザー管理画面改善 • ERDの動線改善 • Snowflake日本語テーブル対応 • Tableau連携 • etc… 毎月大きめの機能リリースをコンスタントに行っています!
© primeNumber Inc. 21 今後について • 直近はdbt連携、DWHから取得するメタデータ強化、コネクタなしでデー タベースを追加する仕組みの追加等を予定 • 皆様の「こんな機能があったらいいな」の声をお待ちしています!
© primeNumber Inc. 22 We are hiring! • データカタログSaaSの開発に興味がある仲間も募集中です! •
PdM、デザイナ、CS、セールス一丸となり上流の要件/仕様策定から 携わることができます。 • エンジニアリングファーストな社風で、価値を生み出せる人が尊重され、 裁量を持てる文化です。 • 数少ない国産プロダクトとして、お客様と一緒に市場を成長させていく 楽しさがあります。 https://recruit.primenumber.co.jp/
Thank you!