Slide 1

Slide 1 text

Outline of the Presentation by Sansan R&D ⾃然⾔語、画像、社会科学領域における 研究開発とビジネス応⽤ 名刺領域の Smart Captured モバイルによるリアルタイム画像認識技術。 従来は困難だった⽩い背景と⽩い名刺との同化、 複雑な背景、 影の重なりといった問題に対応。 ニュース配信のための企業名抽出 辞書を⽤いたルールベースのアルゴリズムと、⽂脈から 抽出を⾏う BERT を組み合わせた固有表現抽出技術を開発。 さらに、能動学習を⽤いて継続的な改善を⾏っている。 転職ネットワークの分析 名刺画像の超解像技術 CNN ベースの超解像モデルを⽤いて、低解像度の名刺画像 から⾼解像度の名刺画像を復元。OCR の認識精度の向上に つながった。 企業の特徴を表現したnode embeddingをレーティング分析 に導⼊し、 各業種が転職市場でもつアドバンテージを推定。 コロナ禍のビジネスの出会いの変化 紙名刺、オンライン名刺の交換データをもとに、コロナ禍 におけるビジネスの出会いの性質の変化を分析、可視化。 Data Visualization として、新しい形でビジネスネット ワークを表現した。 企業のブランド⼒調査とレポーティング Eight の名刺交換ネットワークを⽤いて調査した独⾃の 企業ブランドスコア (Eight Company Score) にもとづき、 企業研究レポート (ECS for アカデミア) を公開。学⽣の ⽅には無償で提供している。 ⻘⾒ 樹 Itsuki Aomi 技術本部 研究開発部 Data Analysisグループ 研究開発部 ※ Eightの利⽤規約で許諾を得ている範囲内で匿名化したEightのデータを統計的に使⽤ 公式Twitter @SansanRandD R&Dの技術や勉強会情報など いち早く情報を発信しています。 https://speakerdeck.com/sansan_randd/dsr13