Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Predicting categories of news articles

andmohiko
September 10, 2019

Predicting categories of news articles

機械学習(自然言語処理)を使ってニュース記事のカテゴリー分類に挑戦した話。

andmohiko

September 10, 2019
Tweet

More Decks by andmohiko

Other Decks in Technology

Transcript

  1. 既存のモデル
 • BoWに変換し、アルゴリズムにはNaive Bayesを採用している。
 BoW: 学習データに出現する全単語にIDを振り、文章をどの単語が何回出現し たか(単語1が2回, 単語2が1回...という形)によって表現する手法
 Naive Bayes:

    ベイズの定理を元にしたアルゴリズム。出現する単語の組み合わ せによって確率を計算する。式を見たら挙動がわかるとてもシンプルな手法。以 降NBと表記する。
 手法