Technical Setup
• データセット
• 複数のtreebankがある言語では最も大きいものを使用
• ‘http’ を含む単語は ‘URL’に置換
• ‘@’を含む単語は ‘EMAIL’に置換
• Hyperparameters
• bidirectional character-level LSTM
• hidden state: 128, character embedding size: 256
• word-level bidirectional LSTM
• 2layers, hidden state 128, dropout 0.5
• MLP
• Size: tagset size, 活性化関数: tanh
5