Upgrade to Pro — share decks privately, control downloads, hide ads and more …

COMETA®開発の裏側をご紹介

 COMETA®開発の裏側をご紹介

Data Engineering Study #25 データカタログの現在地 にてお話しした内容です。
https://forkwell.connpass.com/event/328066/

Manami Nakamura

October 11, 2024
Tweet

More Decks by Manami Nakamura

Other Decks in Programming

Transcript

  1. © primeNumber Inc. 2 中村愛美 株式会社primeNumber COMETAチーム Senior Manager X:

    @mnmandahalf WHO AM I? 2015年にエンジニアとしてキャリアをスタート し、 toB向け基幹業務システム開発、toC向け Webアプリケーション開発、クラウドインフラ構 築、EM等を経験してきました。 2023年6月にprimeNumberに入社し、COMETA® 立ち上げ期の開発リードを担当。2024年5月より 発足したCOMETAチームEM。
  2. © primeNumber Inc. 6 COMETA®の構成要素 • ユーザーがメタデータを閲覧・登録するUI • メタデータを取り込むバッチ ◦

    DWHのメタデータ取り込み ◦ TROCCO®で転送しているメタデータの自動生成 ◦ 検索インデックス生成 ◦ リネージ生成
  3. © primeNumber Inc. 14 ER図 • リレーションのデータは現在3種類の生成方法に対応 ◦ 手動でカラム同士の関連をUIから登録 ◦

    TROCCO®で転送している場合は、転送元のMySQLやPostgreSQLの 外部キー情報を取得して自動生成 ◦ カラム同士の関連をCSVに記載して一括インポート(new!) • クエリエディタでON句を記載した時の補完にも活用されます
  4. © primeNumber Inc. 17 日本語検索対応 • Elasticsearchのプラグインで日本語あいまい検索を実現している ◦ (例)売り上げ /

    売上 • 項目ごとに部分一致、kuromoji analyzer、n-gram等を使い分け • ユーザー辞書への対応など、まだまだカスタマイズの余地あり
  5. © primeNumber Inc. 20 直近3ヶ月のリリース • メタデータの登録状況や推移が確認できるダッシュボード機能 • 大量テーブルのメタデータ取り込みと画面のパフォーマンスチューニング •

    用語集機能 • メタデータCSVエクスポート • ユーザー管理画面改善 • ERDの動線改善 • Snowflake日本語テーブル対応 • Tableau連携 • etc… 毎月大きめの機能リリースをコンスタントに行っています!
  6. © primeNumber Inc. 22 We are hiring! • データカタログSaaSの開発に興味がある仲間も募集中です! •

    PdM、デザイナ、CS、セールス一丸となり上流の要件/仕様策定から 携わることができます。 • エンジニアリングファーストな社風で、価値を生み出せる人が尊重され、 裁量を持てる文化です。 • 数少ない国産プロダクトとして、お客様と一緒に市場を成長させていく 楽しさがあります。 https://recruit.primenumber.co.jp/