$30 off During Our Annual Pro Sale. View Details »

研究開発部メンバーの働き⽅ / Sansan R&D Profile

研究開発部メンバーの働き⽅ / Sansan R&D Profile

Sansan株式会社は、「出会いからイノベーションを生み出す」をミッションとして掲げ、ビジネスにおける出会いを後押ししています。
本資料では研究開発職の働き方に関する情報をまとめています。

◉ 研究開発職 採用情報
募集中のポジションや関連記事など
https://media.sansan-engineering.com/randd

◉ Sansan Tech Blog
Sansanのものづくりを支えるメンバーのテックブログ(R&Dメンバーの連載も多数)
https://buildersbox.corp-sansan.com/

◉ R&Dの登壇資料
これまでの登壇や発表で使用した資料を公開しています。
https://speakerdeck.com/sansan_randd

Sansan, Inc.
PRO

February 28, 2023
Tweet

More Decks by Sansan, Inc.

Other Decks in Technology

Transcript

  1. 研究開発部
    メンバーの働き⽅
    Sansan技術本部

    View Slide

  2. - 会社概要 | Sansanのカタチ - 企業理念
    - 提供サービス
    - 組織構成
    - 研究開発部について
    - キャリアパス
    - DevOps/MLOpsエンジニア
    - データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー
    - 研究開発プロジェクト紹介
    ⽬次

    View Slide

  3. © Sansan, Inc.
    出会いから
    イノベーションを⽣み出す
    いつの時代も、世界を動かしてきたのは出会いです。
    ⼈と⼈、企業と企業、
    その出会いの連鎖が社会を前進させます。
    私たちは出会いが持つ可能性を再発⾒し、
    未来につなげることでビジネスを変えていきます。
    イノベーションにつながる新しい出会いを⽣み出す。
    出会いの⼒でビジネスの課題にイノベーションを起こす。
    そして、ビジネスの出会い、そのもののあり⽅を変えていきます。
    Mission
    会社概要 | Sansanのカタチ - 企業理念

    View Slide

  4. 働き⽅を変えるDXサービス
    4
    提供サービス
    Sansanは、名刺というアナログ情報をデジタル化してデータとして
    活⽤できるようにすることで、
    企業の課題解決を⽀援してきました。
    これからは、名刺管理という分野に限らず、
    営業、経理、契約といった
    より幅広い領域でサービスを展開していくことで、
    DXを推進し、働き⽅を変えていきます。
    Sansanの働き⽅を変えるDXサービスが、
    企業とビジネスパーソンの課題解決を後押しします。

    View Slide

  5. 働き⽅を変えるDXサービス
    5
    提供サービス
    ⼈や企業との出会いをビジネスチャンスにつなげる「働き⽅を変えるDXサービス」を提供
    ビジネスフローにおけるさまざまな分野でサービスを展開
    請求
    営業
    営業DX
    契約
    法務DX 経理DX
    法⼈向けDX
    必要な情報を
    すぐに⾒つけられる
    情報の管理がしやすく
    すぐに共有できる
    情報を分析・活⽤しやすく
    データに基づいた判断ができる
    SansanのDXサービスの活⽤で変わる働き⽅
    名刺管理
    名刺DX
    個⼈向けDX

    View Slide

  6. 働き⽅を変えるDXサービス
    名刺DX
    法務DX
    営業を強くするデータベース
    営業DXサービス
    契約データベースから、収益を最⼤化する
    契約データベース
    営業DX
    経理DX
    請求書受領から、⽉次決算を加速する
    インボイス管理サービス
    タッチで交換。スマートに管理。
    名刺アプリ
    提供サービス

    View Slide

  7. 組織構成の概要
    組織
    4つの主軸プロダクトごとにフロント&プロダクト機能を集約
    PR、ブランディング、ビジネス開発、グローバルビジネス推進 など
    その他の部⾨
    エンジニア、研究開発(R&D)、 システム管理、CSIRT など
    技術本部
    Contract One Unit
    Sansan事業部
    マーケティング、
    インサイドセールス、営業、
    カスタマーサクセス など
    Bill One事業部
    マーケティング、
    インサイドセールス、営業、
    カスタマーサクセス など
    Eight事業部
    マーケティング、
    インサイドセールス、営業
    カスタマーサクセス など
    マーケティング、営業 など
    総務・法務、財務・経理など
    コーポレート本部
    採⽤、労務、育成、制度設計・運⽤など
    ⼈事本部

    View Slide

  8. 技術本部
    組織
    技術本部
    各事業部・プロダクトユニットと連携するEngineering Unitと、Sansanの根幹技術を担う組織が存在。
    Sansan Engineering Unit Eight Engineering Unit
    Bill One Engineering Unit
    Strategic Products Engineering Unit
    Quality Assurance Group データ戦略部
    海外開発拠点⽀援室
    Digitization部
    インフラ戦略部
    コーポレートシステム部
    Mobile Application Group
    研究開発部(R&D) 情報セキュリティ部
    VPoE室
    Data Hub Engineering Unit

    View Slide

  9. 研究開発から事業へのアプリケーション提供・運⽤までを⼿掛ける
    研究開発部
    アカデミア
    活動
    中⻑期的な施策
    ・研究開発
    コア技術の
    開発
    アプリケーション・
    APIのリリース・
    運⽤
    共同研究
    論⽂投稿
    学会協賛
    勉強会主催・参加
    各種サービスのデータ
    構造化
    A/Bテスト
    社内データ分析
    新規サービス検証
    OCR技術
    名寄せ技術
    データ化のための各種
    API
    Sansan Labs
    データ基盤
    デプロイ基盤

    View Slide

  10. 各R&Dテーマの事業領域における位置付け
    研究開発部
    画像処理・画像認

    ⾃然⾔語処理 機械学習
    データサイエンス
    ・因果推論
    データ可視化
    プロダクトマネジメント
    新規事業
    営業/CS
    (社内課題)
    解約阻⽌・利⽤促進(CS)
    営業効率化(営業)
    SceneText
    Recognition
    Object Detection
    ⼊⼒の⾃動化
    OCR/項⽬分割など
    超解像
    特徴語判定
    会社
    キーワード
    固有表現抽出
    メール署名
    取り込み
    固有表現抽出
    ニュース
    配信
    ⽂書分類
    ResNet
    企業ロゴ
    抽出
    Graph
    Embeding
    レコメンデ
    ーション
    ラベル
    予測
    名寄せ
    RCT
    ABテスト
    ・効果検証
    パネルデータ
    分析
    Sansan Labs
    (新機能開発)
    キーバリュー抽出
    帳票のデータ化
    Graph Neural Network

    View Slide

  11. 研究開発部内のメンバー構成
    研究開発部
    研究員 /
    データサイエンティスト
    MLOps / DevOps
    エンジニア
    データエンジニア /
    アナリティクスエンジニア
    プロダクトマネージャー
    プロダクト組織
    主に名刺や帳票の⾼精度なデータ化や蓄積
    されたデータからプロダクトの価値を⾼め
    るデータを活⽤した機能の研究開発から
    サービスリリースまで担う
    サービスの品質・可⽤性・セキュリ
    ティー・オブザーバビリティーを担保
    また研究員による試⾏錯誤を増やし、継続
    的に素早くリリースするためのデプロイ基
    盤を構築・推進
    研究開発部や全社で利⽤する分析基盤の設
    計・開発をリード
    ⾃社のプロダクトから⽣まれるさまざまな
    ログやデータ連携パートナー企業などから
    のデータを、活⽤しやすい形で社内に提供
    プロダクト組織と連携し、各プロダクトを
    連続的・⾮連続的に成⻑させる機能開発・
    検証をリード

    View Slide

  12. データ活⽤を後押しする環境
    研究開発部
    オペレーターと協働できる体制により、
    ⾼品質な学習データの作成が可能
    学習データ
    オペレーター
    学習モデル
    ビジネスデータを集約した
    データ分析基盤でデータ活⽤を推進
    データ
    分析基盤
    プレスリリース
    財務情報 名 刺 企業情報
    発⾏物
    ニュース
    ニュース配信
    ABテスト
    Data Science Report
    レコメンデーション
    ネットワーク分析

    View Slide

  13. プロジェクトの進め⽅
    研究開発部
    ⁃ 3カ⽉に⼀度、全社でOKRを策定する
    ⁃ トップダウン/ボトムアップ両⽅で策定し、
    相互に連携しあう
    ⁃ OKRは漸進的な進歩ではなく、
    ⾶躍のための⽬標
    ⁃ 研究開発部では全てを達成することは
    期待しない野⼼的なOKRと
    コミットするOKRに分ける
    → ⼤きなチャレンジに取り組めるようにしている
    OKR例:
    Sansanの30%グロースのためにプロダクトの価値を⾼める
    → 営業DXを実現するために
    メール署名取り込みの品質を向上させる
    ⁃ X⽉末までにYアルゴリズムの精度(Precision)をZ%にする
    ⁃ …
    → Sansan Labsをスケールさせ、
    営業DXをリードする機能を⽣み出す
    ⁃ X⽉末までに開発のリードタイムを前Q⽐でYY%削減する
    ⁃ X⽉末までにアプリケーションをY件リリースする
    ⁃ …
    OKRの達成のために
    プロジェクトとして取り組む
    壮⼤な⽬標を伝え、測定し、達成するために使う
    ⽬標と主要な結果(OKR)

    View Slide

  14. リーダーの育成 組織の拡⼤ 権限の移譲 フラットな組織に
    スモール開発
    研究開発部
    研究開発部のメンバーは
    1チーム5⼈程度で計10チームに分かれている(2023/11時点)
    - 専⾨領域などで厳密に分かれているものでなく、
    関連するプロジェクトに取り組みやすいようにチームを組んでいる
    - チーム編成の⾒直しは都度⾏っている

    View Slide

  15. 技術スタックと開発フロー
    研究開発部
    主な利⽤⾔語 Python、R、C#、C++
    クラウド AWS、GCP(Google Cloud Platform)
    ソースコード管理 Github
    使⽤するライブラリや
    フレームワーク
    テーマに合わせて⾃由に選択
    サービス本番環境への
    実装
    Dockerコンテナ技術や
    AWS(Batch、Lambda、SageMakerなど)、
    GCP(AppEngine、Kubernetesなど)
    PC
    Windows PC、Macbookから選択。
    AWSやGCPのインスタンスを使⽤可能。
    データ
    収集
    サービス
    構築
    評価
    リリース
    学習
    A/B
    テスト
    前処理
    推論
    機械学習システム
    ワークフロー

    View Slide

  16. 働く上で⼤切にしている価値観
    研究開発部
    Product First
    知⾏合⼀
    ⁃ ユーザーの課題を解決することで事業に貢献する
    ⁃ 技術を磨くことが⽬的になるのではなく、課題解決に向きあう
    ⁃ 本当の知は実践を伴わなければならない
    ⁃ ⼩さく速く課題解決に取り組んでいく姿勢を重視する
    1
    2
    Respect
    ⁃ それぞれのメンバーがプロフェッショナルである⾃負をもち、相互に尊敬・信頼する
    ⁃ プロフェッショナルなメンバーに裁量を与える
    3

    View Slide

  17. 定期開催イベント
    研究開発部
    OKR 進捗会議
    部⻑へ2週間に⼀度、
    進捗状況のみをクイックに
    共有
    Monthly Review
    - チームごとに⽉1回部⻑へ
    取り組み状況を共有
    - 誰でもどのチームの
    Monthly Reviewに出ること
    ができる
    テックトーク
    (他部署からの参加歓迎!)
    週1回、有志で各⾃取り組ん
    でいることや技術紹介のLTを
    している
    論⽂読み会
    2週間に1度、有志で読んだ論
    ⽂の内容を共有する
    勉強会
    ⽉に1回、持ち回りで各⾃が
    取り組んでいることや技術紹
    介のLTをしている

    View Slide

  18. キャリアパス
    18
    成⻑機会
    ミッショングレード(役割等級制)を導⼊。各グレードごとに期待される役割や難易度が変わります
    ミッショングレードが上がるほど、影響範囲が広がる
    例)個⼈→チーム→グループ→部→会社と変化
    社内との調整だけでなく、社外との調整も担当 など
    各グレードごとの給与設定
    アシスタント
    グループマネジャー
    (MS以上)
    グループマネジャー
    (M1以上)
    副部⻑(M3以上)
    部⻑(M4以上)
    事業部⻑ / 本部⻑
    ※上記は基本的なキャリアパス

    View Slide

  19. DevOps/MLOpsエンジニア

    View Slide

  20. DevOps/MLOpsエンジニア
    - 研究員と協⼒して、開発や運⽤における課題に対する技術的な解決の推進
    - データ化の⾃動化を⽀え、推進するための取り組み
    - ⾼精度・低コスト・⼤量のスループット全てを満たすデータ化システムの
    設計・構築・運⽤
    - 研究員が開発したアルゴリズムや機械学習モデルを本番環境で稼働させる
    ためのサービス品質・可⽤性・セキュリティ・オブザーバビリティの担保
    - 研究開発部内の⽣産性向上への取り組み
    期待/役割

    View Slide

  21. 名刺データ⼊⼒の⾃動化
    DevOps/MLOpsエンジニア | データ化の⾃動化
    解決策
    名刺データ化システム「GEES」
    - ⾼速・低コスト・セキュアなデータ化⽤に細分化されたマイクロタスクの集合体
    画像処理技術による⾃動化
    - NineOCR:名刺に特化した独⾃OCRエンジン
    - スマートキャプチャー:On-device名刺検出+OCRエンジンによる即時納品
    - ⾔語・⼿書き⽂字判定:⽂字情報によらない名刺の属性判定
    結果
    - 名刺データ⼊⼒コストの削減
    - ユーザーが即時に使える⼀次納品のデータ化精度向上
    ビジネス課題
    100%に近い精度を実現しながら、データ化にかかるコストの最⼩化と納品スピードの向上
    ⾔語判定
    ⽂字情報によらない名刺の属性判定
    スマートキャプチャー
    On-device名刺検出+OCRエンジンによる
    即時納品
    NineOCR
    名刺に特化した独⾃OCRエンジン

    View Slide

  22. 請求書データ⼊⼒の⾃動化
    DevOps/MLOpsエンジニア | データ化の⾃動化
    請求書画像⼊⼒/
    データ化システム
    ⼊⼒
    データ化
    ⾃動化エンジン
    オペレーター
    名刺データ化ノウハウを活かした、請求書データ化システム
    請求書画像
    請求書データ
    ユーザ企業
    Bill One Entry

    View Slide

  23. 請求書データ⼊⼒の⾃動化アーキテクチャ
    DevOps/MLOpsエンジニア | データ化の⾃動化
    https://cloud.google.com/blog/ja/topics/customers/sansan-digitizing-the-analog-invoice-process

    View Slide

  24. 機械学習(ML)開発フロー
    DevOps/MLOpsエンジニア | 機械学習(ML)開発
    データ
    収集
    サービス
    構築
    評価
    リリース
    学習
    A/B
    テスト
    前処理
    推論
    機械学習システム
    ワークフロー
    データエンジニア
    研究員
    DevOpsエンジニア
    機械学習モデル開発
    A/Bテストの設計
    推論結果をモデルにフィードバック
    研究員が作った機械学習モデルを
    本番環境のサービスに載せる MLモデル開発が終わったら
    エンジニアにサービス化を依頼する

    View Slide

  25. 機械学習(ML)開発フローの課題
    DevOps/MLOpsエンジニア | 機械学習(ML)開発
    毎回ゼロから
    サービス構築するため
    ボトルネックになりがち
    研究員が安全にセルフサービスで
    リリースできる環境を
    整えることによって
    仮説検証スピードが向上し、
    爆速でサービスリリースできる
    データ
    収集
    サービス
    構築
    評価
    リリース
    学習
    A/B
    テスト
    前処理
    推論
    機械学習システム
    ワークフロー

    View Slide

  26. DevOps/MLOpsエンジニア | 機械学習(ML)開発
    研究員が、セルフサービスで安全に本番クラウド環境にアプリケーションを
    リリースできる基盤
    - Kubernetesを利⽤したコンテナプラットフォーム
    - ワークロードに応じたKubernetesリソーステンプレートを提供
    - ボタンひとつでテンプレートを⽣成し、GitHubへのPull Requestを
    作成するGithub Actionsを提供
    アプリケーション基盤:Circuit
    R&Dのアプリケーション基盤 “Circuit”について
    https://speakerdeck.com/sansan_randd/about-circuit-r-and-ds-application-platform

    View Slide

  27. - R&D 共通の Actions を作成し、各リポジトリから参照する仕組み
    - reusable workflow
    - composite action
    - 共通 Actions を管理するレポジトリを運⽤
    - 参照元を修正すればすべてのリポジトリに反映
    - 設定ファイルのメンテナンスコスト削減
    - 共通 Actions の例
    - 単体テスト
    - リンター
    - コンテナイメージのビルド/プッシュ
    GitHub ActionsによるCI/CDの導⼊
    DevOps/MLOpsエンジニア | 機械学習(ML)開発

    View Slide

  28. - 開発時の負荷低減
    - 開発を始める際に悩まなくてよい
    - フレームワーク、ログ、ディレクトリ構成、...
    - テンプレを⽤意することでコードベースが同じ
    - レビューがしやすい
    - 開発に⾃⾝がなくても⼀通り揃った状態からロジックを埋めれば良い
    - ⽤意しているテンプレ例
    - web app
    - web api
    - batch
    - k8s yaml
    サービス開発時のテンプレート作成
    DevOps/MLOpsエンジニア | 機械学習(ML)開発

    View Slide

  29. やりがい
    DevOps/MLOpsエンジニア
    成果が⾒えやすい
    処理の⾼精度化等のシステム改修
    は、ユーザ体験向上やコスト削減
    等のかたちですぐ成果が⾒えやす
    いです。
    データ化という当社の価値の根源
    を受け持ち、責任は⼤きいものの、
    成果もまたインパクトの⼤きなも
    のになります。必要とされる仕事
    だという実感を常に持てます。
    研究員と距離が近い
    新規開発・モダナイズに
    携われる
    研究員と組織上⼀体化したり、
    定例会議を設けるなど、密なチャ
    ネルを持つようにしています。
    新規施策の話、業務での困りごと
    や改善プランなど、研究員と互い
    にそういったトピックをすぐ拾い
    上げて実⾏に移せる体制づくりを
    しています。
    新規サービスを作ることも、古参
    サービスの運⽤やモダナイズをす
    ることもあり、様々な業務に携わ
    ります。
    マイクロサービスが多いため、
    ⼀つ⼀つの開発・運⽤は⽐較的
    難易度低く、かつ⼤きな裁量で
    ⾏えます。

    View Slide

  30. データエンジニア
    アナリティクスエンジニア
    データプロダクトマネジャー

    View Slide

  31. データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー
    - データに基づく意思決定をするためには、データそのものだけでは不⼗分
    - データを継続的に収集、蓄積して活⽤しやすいように整備する基盤が必要
    - 各部署でデータ基盤は整備されているが、データが分散している状態
    (データのサイロ化)
    全社横断データ基盤の必要性と課題
    データを使った意思決定を5分で⾏える世界の実現を⽬指しており、
    その実現にはデータ基盤の構築、ノウハウ・知⾒を貯めるための環境づくり、
    および意思決定をリードする活動が重要

    View Slide

  32. - 各プロダクトのデータオーナーと連携し、データ収集パイプラインの設計・構築
    - Google Cloud上での分析基盤構築及び運⽤業務
    - メタデータ管理システム構築、運⽤
    - データガバナンスシステム構築、運⽤
    - 各プロダクトへのデータ利活⽤⽀援
    データエンジニアの主な役割
    データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー
    データ意思決定を⽀えるデータインフラ及びデータパイプラインの構築

    View Slide

  33. - データアナリストと協⼒し、各プロダクトのデータを分析することでの、データを使った
    意思決定の推進
    - アプリ開発者と協⼒してのデータプロダクト構築⽀援
    - データエンジニアと協⼒し、データマートやDWHの設計・構築・運⽤
    - メタデータ整備
    - BIツールの利⽤ルール浸透や権限整備
    - データガバナンスの整備
    アナリティクスエンジニアの主な役割
    データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー
    基盤利⽤者、データエンジニアと協⼒して、データを使った意思決定の促進のための
    エンジニアリング業務

    View Slide

  34. - 全社横断データ基盤構築のリード
    - データレイク・データウェアハウス・データマートの設計、構築リード
    - 全社横断データ基盤を⽤いたデータ活⽤の普及・促進
    - 全社にわたるデータガバナンス・データリネージ・データ品質に関する取り組みのリード
    - データ活⽤を加速させるための技術選定や導⼊
    - 社内データ活⽤・Sansan Labs アプリケーションのリード
    - 社内の各部⾨と連携して、データ活⽤の仮説検証や課題解決
    - 仮説検証、全社横断データ基盤を⽤いたソリューション構築、導⼊
    データプロダクトマネジャーの主な役割
    データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー
    社内のビジネス課題を解決するための新機能のプロダクトマネジメント、
    データ活⽤を加速するためのデータ基盤構築のリード

    View Slide

  35. 権限と責務
    データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー
    データ基盤
    データソース
    DB
    ログ
    ファイル
    データ所有者
    BigQuery
    Cloud Composer
    (Apache Airflow)
    データ
    レイク DWH
    データ
    マート
    メタデータ
    データ
    収集
    エンドユーザー
    PdM、開発者
    Looker
    データ
    活⽤
    データ基盤利⽤者
    データアナリスト
    アプリ開発者
    データプロダクトマネジャー
    アナリティクスエンジニア
    データエンジニア Amazon EKS

    View Slide

  36. データ基盤アーキテクチャ
    データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー
    Cloud
    Storage
    Amazon S3
    Amazon Aurora
    Storage
    Transfer
    Service
    Cloud SQL
    Logging
    Cloud
    Composer
    Project データ基盤
    Data lake
    BigQuery
    Project データ分析A
    BigQuery
    DWH
    BigQuery
    Data mart
    BigQuery
    Project データ分析B
    BigQuery
    Group A Group B
    データ基盤エンジニア
    その他
    AWSリソース
    Azure Blob
    Storage
    Salesforce

    View Slide

  37. やりがい
    データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー
    多種多様なデータや
    モダンなシステムに携われる
    扱うデータは、その量と独⾃性で
    他に類を⾒ません。
    膨⼤なデータに向き合うことも、
    データ⼀つひとつに泥臭く向き合
    うこともあります。
    データベースの多くはGoogle
    Cloud上に構築されており、
    Modern Data Stackやサーバーレ
    スアーキテクチャ、並列分散処理
    などを⽤いたモダンなシステム開
    発を担当できます。
    さまざまな部署のメンバーと
    切磋琢磨できる
    インパクトの⼤きい
    プロジェクトをリードできる
    データ×テクノロジー×オペレー
    ション(⼈⼒)を最⼤限に活⽤
    したプロダクトに携われます。
    どれかを偏重するのではなく、
    プロダクト側やデータアナリスト
    とも連携しながら開発を進めてい
    きます。
    また、少⼈数のチームを組むため
    ⼀⼈⼀⼈の裁量は⼤きく、⾃分の
    アイデアを存分に⽣かせます。
    データプロダクトマネジャーは
    「営業DXをドライブする機能を
    ⽣み出す」「データ活⽤で社内の
    ビジネス課題を解決する」という
    2つのミッションの実現を⽬指し、
    プロジェクトを推進できるポジ
    ションです。
    ユーザーや社内の他部⾨へのヒア
    リングを通じて課題を特定し、課
    題解決を形にするところまで⼀気
    通貫で携わることができます。

    View Slide

  38. 「データを使った意思決定を5分で⾏える世界」を実現するための活動
    今後の展開
    データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー
    - データを活⽤した意思決定を⾼速化する
    - 社内のデータ活⽤事例を創出する
    - データアナリスト・データサイエンティストのデータ分析に要する時間を短縮する
    - 各プロダクトのドメイン知識を蓄積
    - データウェアハウス上のデータ整備
    - データソース追加に要する開発⼯数の短縮化
    既存データ基盤の統合
    - データのサイロ化を解消し、データ管理の運⽤負荷とコストを削減する

    View Slide

  39. 研究開発プロジェクト紹介

    View Slide

  40. グラフ機械学習を活⽤した検索・レコメンデーション
    Eight × Graph Embeding
    解決策
    企業間名刺交換ネットワークにGraph Embedding(node2vec)を
    適⽤して、各企業をベクトル形式の特徴量で表現し、
    埋め込み空間上で企業間類似度を計算
    結果
    - Eight Career Designの候補者検索において、
    特定企業に類似している企業で勤めている候補者が検索可能
    - ニュース配信のレコメンデーションに活⽤し、
    同業他社の動向を⾃動で取得可能
    ※Eightの利⽤規約の許諾範囲内で 匿名化したデータを統計的に利⽤しています。
    A社: (0.4, 0.2, 0.1, …, 0.8)T
    B社: (0.1, 0.5, 0.1, …, 0.2)T
    F社: (0.5, 0.1, 0.7, …, 0.5)T
    G社: (0.6, 0.7, 0.8, …, 0.6)T
    ビジネス課題 企業間名刺交換 Eight ネットワーク
    A社
    D社
    B社
    C社
    E社
    F社
    G社

    特定の企業と同業界・同業態の企業を検索したり、
    ニュースを配信する体験をつくる

    View Slide

  41. レイアウトを考慮した帳票からの情報抽出
    帳票データ × ⾃然⾔語処理 & Graph Neural Network
    解決策
    テキストとそのレイアウトを特徴とするモデルによる情報抽出
    結果
    既存システムからの⾃動化率の向上
    1. 構造化 2. グラフ化 3. GNN 4. タグ予測
    請求⾦額
    10,000
    ビジネス課題
    スケーリングを⽬的とした、請求書や契約書のデータ化の⾃動化

    View Slide

  42. メール署名取り込み
    Sansan メール署名取り込み × ⾃然⾔語処理
    解決策
    メールから名刺相当の構造化された顧客情報を⾃然⾔語処理
    (固有表現抽出や構⽂解析、辞書などによるスコアリング)を活⽤
    することで抽出する
    結果
    メールでのつながりの情報を企業の資産として蓄積し、
    営業⼒を強化するというコンセプトを
    プロダクト上で実現できた
    図:メール署名取り込みのイメージ図
    ビジネス課題
    メールだけでやりとりをしていて名刺交換できていない相⼿の連絡先を、
    メールの署名から抽出し企業の資産として蓄積する

    View Slide

  43. モバイルアプリ内での効果的な利⽤訴求メッセージの特定
    Sansan × 因果推論(RCT)
    解決策
    ABテストで複数の訴求メッセージの中から
    効果的なものを特定
    結果
    - ⽬標値を上回る利⽤実績を実現
    - 利⽤訴求メッセージの違いを定量的に判断でき、
    カスタマーサクセスのメッセージ作成にも
    知⾒が蓄積された
    商談前に、つながりを検索。
    相⼿と同僚との接点を確認しよう
    スマホで⼈脈をサクサク検索。
    商談相⼿とのつながりを事前に把握しよう
    A案
    B案
    Sansanモバイルアプリ上で
    特定の機能を使⽤したことがないユーザーに対し、
    効果的に利⽤促進するメッセージを特定する
    ビジネス課題

    View Slide

  44. 研究開発部の採⽤情報
    各種募集ポジションや関連記事などを
    Notionにまとめています
    研究開発部のメンバー紹介
    所属するメンバーのバックグラウンドや
    これまでの発表掲載実績などをまとめています
    https://media.sansan-engineering.com/randd
    https://sansan-engineering.notion.site/0afd3852e1d84695aff717be048e5062

    View Slide

  45. View Slide