Upgrade to Pro — share decks privately, control downloads, hide ads and more …

R&D自動評価基盤の取り組み / Design of Auto-Evaluation Infrastructure for Sansan R&D

R&D自動評価基盤の取り組み / Design of Auto-Evaluation Infrastructure for Sansan R&D

■イベント
DevLOVE関西
https://devlove-kansai.doorkeeper.jp/events/171858

■発表者
技術本部 研究開発部 Architectグループ
辻田 美咲

■研究開発職 採用情報
https://media.sansan-engineering.com/randd

■Sansan Tech Blog
https://buildersbox.corp-sansan.com/

Sansan R&D

May 09, 2024
Tweet

More Decks by Sansan R&D

Other Decks in Technology

Transcript

  1. 辻⽥ 美咲 Sansan株式会社 技術本部 研究開発部 Architectグループ - 2021年 Sansan⼊社 -

    Architectグループ takowasaチーム所属 - DevOps/MLOps Engineer
  2. さまざまな事業領域に貢献するR&D 画像処理・画像認識 ⾃然⾔語処理 機械学習 データサイエンス ・因果推論 データ可視化 プロダクトマネジメント 新規事業 営業/CS

    (社内課題) 解約阻⽌・利⽤促進(CS) 営業効率化(営業) SceneText Recognition Object Detection ⼊⼒の⾃動化 OCR/項⽬分割など 超解像 特徴語判定 会社 キーワード 固有表現抽出 メール署名 取り込み 固有表現抽出 ニュース 配信 文書分類 ResNet 企業ロゴ 抽出 Graph Embeding レコメンデ ーション ラベル 予測 名寄せ RCT ABテスト ・効果検証 パネルデータ 分析 Sansan Labs (新機能開発) キーバリュー抽出 帳票のデータ化 Graph Neural Network
  3. 研究開発部内のメンバー構成 研究員 / データサイエンティスト MLOps / DevOps エンジニア データエンジニア /

    アナリティクスエンジニア プロダクトマネジャー プロダクト組織 主に名刺や帳票の⾼精度なデータ化や蓄積 されたデータからプロダクトの価値を⾼め るデータを活⽤した機能の研究開発からサ ービスリリースまで担う サービスの品質・可⽤性・セキュリティ・ オブザーバビリティを担保 また研究員による試⾏錯誤を増やし、継続 的に素早くリリースするためのデプロイ基 盤を構築・推進 研究開発部や全社で利⽤する分析基盤の設 計・開発をリード ⾃社のプロダクトから⽣まれるさまざまな ログやデータ連携パートナー企業などから のデータを、活⽤しやすい形で社内に提供 プロダクト組織と連携し、各プロダクトを 連続的・⾮連続的に成⻑させる機能開発・ 検証をリード
  4. ML開発フローの課題 アプリケーション基盤”Circuit” によって改善した部分 データ 収集 サービス 構築 評価 リリース 学習

    A/B テスト 前処理 推論 機械学習システム ワークフロー MLプロジェクトにおいて⼤半を 占める前処理部分には、基盤が 存在しない。 ⾃動化等は各サービス担当者に 依存している。