Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CNNによるテキスト分類

 CNNによるテキスト分類

けんご

March 02, 2016
Tweet

More Decks by けんご

Other Decks in Technology

Transcript

  1. CNNのNLPへの適用 • 分類したいテキストに含まれる単語をベクトル化 • それを並べた行列がそのテキストの表現 • 単語数が一致しない場合はパディングで埋める 犬も猫も好き 犬 も

    猫 も 好き    ʜ    ʜ ʜ ʜ ʜ トトロが好き トトロ が 好き <PAD> <PAD>    ʜ    ʜ ʜ ʜ ʜ “トトロ”のベクトル “犬”のベクトル
  2. 参考 • Convolutional Neural Networks for Sentence Classification • http://arxiv.org/pdf/1408.5882v2.pdf

    • word2vec • https://code.google.com/archive/p/word2vec/ • 実装 • https://github.com/tkengo/tf/blob/master/cnn_text_classification/train.py • TensorFlow • https://www.tensorflow.org/