Slide 1

Slide 1 text

Salesforce Dataに 使えそうなAI論文紹介 株式会社ジェニオ 代表取締役 石井 大輔 www.team-ai.com www.jenio.co

Slide 2

Slide 2 text

2

Slide 3

Slide 3 text

熱量のあるAI勉強会を500回以上開催 500+

Slide 4

Slide 4 text

4

Slide 5

Slide 5 text

5

Slide 6

Slide 6 text

論文:偽ニュース検出のための自然言語処理に関する調査 (2018年11月2日に提出) 偽のニュースの検出は、自然言語処理(NLP)における重要かつ挑戦的な問題です。ソーシャルネッ トワーキングプラットフォームの急速な台頭により、情報のアクセシビリティが大幅に向上しただけで なく、偽のニュースの拡散も加速しています。大量のWebコンテンツを考えると、自動偽ニュース検出 は、すべてのオンラインコンテンツプロバイダーが必要とする実用的なNLP問題です。このホワイト ペーパーでは、偽のニュース検出に関する調査を紹介します。私たちの調査では、自動偽ニュース 検出の課題を紹介しています。このタスクのために開発されたデータセットとNLPソリューションを体 系的にレビューします。また、これらのデータセットと問題の定式化の限界、洞察、および推奨される 解決策についても説明します。

Slide 7

Slide 7 text

論文:ドメイン固有の知識ベースを使用したトピックラベル (2018年6月3日に提出(v1) トピックモデルは自然言語処理で広く使用されており、研究者はドキュメントのコレクションの基礎とな るテーマを推定できます。ほとんどのトピックモデルは教師なしの方法を使用するため、推定トピック に意味のあるラベルを付ける追加の手順が必要です。手動ラベル付けのこのプロセスはスケーラブ ルではなく、人間のバイアスに悩まされています。これらの問題を改善しようとする半自動転送トピッ クラベリング方法を提示します。ドメイン固有のコードブックは、トピックの自動ラベル付けの知識ベー スを形成します。比較議題プロジェクトのコーディング手順を使用してトピックにラベルを付けること で、英国下院のスピーチ1935-2014の完全なコーパスの動的トピックモデル分析によるアプローチを 示します。私たちの方法は、推定するトピックの大半でうまく機能することを示しています。しかし、特 にサブナショナルガバナンスに関する機関固有のトピックには、手作業による入力が必要であること がわかりました。人間の専門的なコーディングを使用して結果を検証します。

Slide 8

Slide 8 text

論文:マルチクラス分類のためのCNNに基づいた通話記録の分 析による顧客の通話意図の予測 (2019年7月8日に提出) 自動車ディーラーは、販売、サービス、ベンダー、求職者に興味がある顧客から毎日何千もの電話を 受けます。非常に多くのコールがあるため、自動車ディーラーはこれらのコールの意図を理解して、 顧客満足、確実な顧客エンゲージメントを確保し、売り上げと収益を高め、ビジネス全体でのエージェ ントまたはカスタマーサービス担当者の最適な割り当てを保証するポジティブなカスタマーエクスペリ エンスを提供することが非常に重要です。このペーパーでは、顧客の通話意図の問題を、記録され た通話記録の大規模なデータベースに起因するマルチクラス分類問題として定義します。この問題 を解決するために、畳み込みニューラルネットワーク(CNN)ベースの教師あり学習モデルを開発 し、顧客の呼び出しを4つの意図カテゴリ(販売、サービス、ベンダー、求職者)に分類します。

Slide 9

Slide 9 text

- Keyword Extraction 抽出 - Sentiment Analysis 感情分析 - Multi Lingual 多言語 Google Natural Language API

Slide 10

Slide 10 text

- Summary 文脈まとめ - TF-IDF 頻度分析 - PDF / Microsoft Word ドキュメント解析 Rakuten Rapid API Marketplace

Slide 11

Slide 11 text

- Salesforce Tower SF - Benioff Children Hospital SF 私とSalesforce