Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DEIM2022 - Sansan R&D

Sansan R&D
February 24, 2022

DEIM2022 - Sansan R&D

■Sansan株式会社 研究開発部
自然言語、画像、社会科学領域における 研究開発とビジネス応用

■DEIM2022
第14回データ工学と情報マネジメントに関するフォーラム
(第20回日本データベース学会年次大会)
https://event.dbsj.org/deim2022/

■ R&Dの採用情報
https://media.sansan-engineering.com/randd

Sansan R&D

February 24, 2022
Tweet

More Decks by Sansan R&D

Other Decks in Research

Transcript

  1. Outline of the Presentation by Sansan R&D ⾃然⾔語、画像、社会科学領域における 研究開発とビジネス応⽤ 名刺領域の

    Smart Captured モバイルによるリアルタイム画像認識技術。 従来は困難だった⽩い背景と⽩い名刺との同化、 複雑な背景、 影の重なりといった問題に対応。 ニュース配信のための企業名抽出 辞書を⽤いたルールベースのアルゴリズムと、⽂脈から 抽出を⾏う BERT を組み合わせた固有表現抽出技術を開発。 さらに、能動学習を⽤いて継続的な改善を⾏っている。 転職ネットワークの分析 名刺画像の超解像技術 CNN ベースの超解像モデルを⽤いて、低解像度の名刺画像 から⾼解像度の名刺画像を復元。OCR の認識精度の向上に つながった。 企業の特徴を表現したnode embeddingをレーティング分析 に導⼊し、 各業種が転職市場でもつアドバンテージを推定。 コロナ禍のビジネスの出会いの変化 紙名刺、オンライン名刺の交換データをもとに、コロナ禍 におけるビジネスの出会いの性質の変化を分析、可視化。 Data Visualization として、新しい形でビジネスネット ワークを表現した。 企業のブランド⼒調査とレポーティング Eight の名刺交換ネットワークを⽤いて調査した独⾃の 企業ブランドスコア (Eight Company Score) にもとづき、 企業研究レポート (ECS for アカデミア) を公開。学⽣の ⽅には無償で提供している。 ⻘⾒ 樹 Itsuki Aomi 技術本部 研究開発部 Data Analysisグループ 研究開発部 ※ Eightの利⽤規約で許諾を得ている範囲内で匿名化したEightのデータを統計的に使⽤ 公式Twitter @SansanRandD R&Dの技術や勉強会情報など いち早く情報を発信しています。 https://speakerdeck.com/sansan_randd/dsr13