Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CNNによるテキスト分類

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

 CNNによるテキスト分類

Avatar for けんご

けんご

March 02, 2016
Tweet

More Decks by けんご

Other Decks in Technology

Transcript

  1. CNNのNLPへの適用 • 分類したいテキストに含まれる単語をベクトル化 • それを並べた行列がそのテキストの表現 • 単語数が一致しない場合はパディングで埋める 犬も猫も好き 犬 も

    猫 も 好き    ʜ    ʜ ʜ ʜ ʜ トトロが好き トトロ が 好き <PAD> <PAD>    ʜ    ʜ ʜ ʜ ʜ “トトロ”のベクトル “犬”のベクトル
  2. 参考 • Convolutional Neural Networks for Sentence Classification • http://arxiv.org/pdf/1408.5882v2.pdf

    • word2vec • https://code.google.com/archive/p/word2vec/ • 実装 • https://github.com/tkengo/tf/blob/master/cnn_text_classification/train.py • TensorFlow • https://www.tensorflow.org/