Slide 1
Slide 1 text
Outline of the Presentation by Sansan R&D
⾃然⾔語、画像、社会科学領域における 研究開発とビジネス応⽤
名刺領域の Smart Captured
モバイルによるリアルタイム画像認識技術。
従来は困難だった⽩い背景と⽩い名刺との同化、
複雑な背景、
影の重なりといった問題に対応。
ニュース配信のための企業名抽出
辞書を⽤いたルールベースのアルゴリズムと、⽂脈から
抽出を⾏う BERT を組み合わせた固有表現抽出技術を開発。
さらに、能動学習を⽤いて継続的な改善を⾏っている。
転職ネットワークの分析
名刺画像の超解像技術
CNN ベースの超解像モデルを⽤いて、低解像度の名刺画像
から⾼解像度の名刺画像を復元。OCR の認識精度の向上に
つながった。
企業の特徴を表現したnode embeddingをレーティング分析
に導⼊し、
各業種が転職市場でもつアドバンテージを推定。
コロナ禍のビジネスの出会いの変化
紙名刺、オンライン名刺の交換データをもとに、コロナ禍
におけるビジネスの出会いの性質の変化を分析、可視化。
Data Visualization として、新しい形でビジネスネット
ワークを表現した。
企業のブランド⼒調査とレポーティング
Eight の名刺交換ネットワークを⽤いて調査した独⾃の
企業ブランドスコア (Eight Company Score) にもとづき、
企業研究レポート (ECS for アカデミア) を公開。学⽣の
⽅には無償で提供している。
⻘⾒ 樹
Itsuki Aomi
技術本部 研究開発部
Data Analysisグループ
研究開発部
※ Eightの利⽤規約で許諾を得ている範囲内で匿名化したEightのデータを統計的に使⽤
公式Twitter
@SansanRandD
R&Dの技術や勉強会情報など
いち早く情報を発信しています。
https://speakerdeck.com/sansan_randd/dsr13