CNNによるテキスト分類

 CNNによるテキスト分類

Eca2f293c36947e2a8944b39e57d105c?s=128

けんご

March 02, 2016
Tweet

Transcript

  1. 9.

    CNNのNLPへの適用 • 分類したいテキストに含まれる単語をベクトル化 • それを並べた行列がそのテキストの表現 • 単語数が一致しない場合はパディングで埋める 犬も猫も好き 犬 も

    猫 も 好き    ʜ    ʜ ʜ ʜ ʜ トトロが好き トトロ が 好き <PAD> <PAD>    ʜ    ʜ ʜ ʜ ʜ “トトロ”のベクトル “犬”のベクトル
  2. 16.
  3. 17.

    参考 • Convolutional Neural Networks for Sentence Classification • http://arxiv.org/pdf/1408.5882v2.pdf

    • word2vec • https://code.google.com/archive/p/word2vec/ • 実装 • https://github.com/tkengo/tf/blob/master/cnn_text_classification/train.py • TensorFlow • https://www.tensorflow.org/