Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CNNによるテキスト分類

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 CNNによるテキスト分類

Avatar for けんご

けんご

March 02, 2016
Tweet

More Decks by けんご

Other Decks in Technology

Transcript

  1. CNNのNLPへの適用 • 分類したいテキストに含まれる単語をベクトル化 • それを並べた行列がそのテキストの表現 • 単語数が一致しない場合はパディングで埋める 犬も猫も好き 犬 も

    猫 も 好き    ʜ    ʜ ʜ ʜ ʜ トトロが好き トトロ が 好き <PAD> <PAD>    ʜ    ʜ ʜ ʜ ʜ “トトロ”のベクトル “犬”のベクトル
  2. 参考 • Convolutional Neural Networks for Sentence Classification • http://arxiv.org/pdf/1408.5882v2.pdf

    • word2vec • https://code.google.com/archive/p/word2vec/ • 実装 • https://github.com/tkengo/tf/blob/master/cnn_text_classification/train.py • TensorFlow • https://www.tensorflow.org/