Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ベトナム語の感情解析

vhqviet
January 08, 2018
90

 ベトナム語の感情解析

2018/01/09

vhqviet

January 08, 2018
Tweet

Transcript

  1. 感情解析の役割 4  製品のレビューが POS であるか NEG か、顧客のフィードバックが満足または 不満であることを特定する。 

    製品を選ぶ際の顧客だけでなく、製造および製造業者にとっても非常に有用  感情分析におけるいくつかの挑戦的側面には、意見用語の識別、感情の強さ 、文の複雑さ、異なる文脈における言葉、複雑な記事に対する感情分類など が含まれる。
  2. 感情分類レベル 7  レビュー全体から感情が抽出され、全体的な意見は、意 見保持者の全体的な感情に基づいて分類される。  目的はレビューを POS 、 NEG

    、または NEU なものとして 分類すること。  文書レベルの分類は、文書が 1 人によって書かれ、単一 の実体上に意見 / 感情を表現するときに最も効果的。 例えば: Mình đã mua m t chi c iPhone cách đây vài ngày. ộ ế Ki u dáng khá là đ p, m c dù h i l n m t chút. Màn hình c m ể ẹ ặ ơ ớ ộ ả ng r t nh y. ứ ấ ạ ( 私は数日前に iPhone を買った。 少し大きめです が、デザインはきれい 。 タッチスクリーンは非常に敏感だ。 ) 感情分類 文書レベ ル ( document level) 文章レベ ル ( sentence level) 様相レベ ル (aspect level)
  3. 感情分類レベル 8  文章の主観的分類を 2 つのクラスに分類する:客観的と 主観的  主観的文章の感情分類を 2

    つのクラスに分類する: POS と NEG   例えば: HP dv 4 có giá quá cao. ( HP dv 4 の価格が高 すぎ。) 感情分類は文書レベルと文章レベルの両方で有用ですが、人々 が好きで嫌いなものを正確に見つけることはできない。 感情分類 文書レベ ル ( document level) 文章レベ ル ( sentence level) 様相レベ ル (aspect level)
  4. 感情分類レベル 9 様相レベルの分析では、製品の良いな側面と悪いな側面を分 析できます。様相レベルの分析には、以下のように含まれる ( a )アスペクトの識別が分析される。 ( b )審査の中で特定された様相についての感情を特定する

    ( c )局面について表現された感情の極性を決定すること。 例えば: laptop của Dell cực kì bền, thiết kế khá đẹp, giá cả phải chăng. ( Dell のノートパソコンは非常に耐久性、美しいデザ イン、手頃な価格 )→  Aspect: デザイン , 価格 感情分類 文書レベ ル ( document level) 文章レベ ル ( sentence level) 様相レベ ル (aspect level)
  5. 10 感情解析の手法 意見の 2 つの主な形 • 定期的な意見:製品に対する意見表現。 • 直接の意見 :

    “HP dv 4 có thiết kế bắt mắt” (HP dv 4 には目を引くデザインがある) • 間接的な意見 : “Đồng hồ mới mua 2 ngày rồi không chạy nữa” (2 日前に新しい時計を買うだけで、 動作が停止した ) • 比較意見:複数の製品の比較 “Điện thoại Android tốt hơn iOS” (Android の携帯電話は iOS より優れる ) Source: Liu, NLP handbook, 2010 → 感情を分析することは難しい → 負または正の値は、どの製品 が考慮されているかによって異なる
  6. 11 感情解析の手法 意見は次のように表される : (entity, aspect, sentiment, holder, time) ここで、

    entity: 感情の対象 aspect: entity の特徴 sentiment: NEG や NEU や POS. holder: 感情の持ち人 time: 意見が表明された時 Source: Liu, NLP handbook, 2010
  7. 12 感情解析の手法 意見は次のように表される : (entity, aspect, sentiment, holder, time) •

    例えば: Thành viên: Nguyên: “Mình đã mua m t chi c ộ ế iPhone cách đây vài ngày. Ki u dáng ể khá là đ p ẹ , m c dù h i ặ ơ l n ớ m t chút. ộ Màn hình c m ng ả ứ r t ấ nh y ạ . Nh ng ư ông anh b o ả giá quá cao.” ( メンバー :Nguyên: “ 私は数日前に iPhone を買った。 少し大きめですが、デザインはき れい 。 タッチスクリーンは非常に敏感だ。 しかし、兄は価格が高すぎると言った” ) ( iPhone, Ki u dáng ( ể デザイン ), POS , Nguyên, none ) ( iPhone, Màn hình c m ng( ả ứ タッチスクリーン ), POS , Nguyên, none ) ( iPhone, giá ( 価格 ), NEG , ông anh( 兄 ), none ) ... Source: Liu, NLP handbook, 2010
  8. 13 感情解析の手法 2 つの技術 • 意味解析技術 意見の感情的な方向付けを伴う単語( lexicons )の辞書の使用に よって特徴付けられる

    • 機械学習技術 注釈付きテキストの集合から教師付き学習アルゴリズムを使用して分 類器を訓練することからなる
  9. 14 感情解析の手法 意味解析技術 言葉は感情や意見を表現する: POSITIVE : tốt (良い)、 tuyệt vời

    (素晴らしい)、 ấn tượng (驚くべき)、 ... NEGATIVE : xấu ( 悪い ) 、 tệ hại ( 悪い ) 、 kinh khủng ( 恐ろしい ) 、 ... sentiment lexicon or opinion lexicon VnEmoLex には合計 12,795 語があり ,  以下のように表される: • 8 つの基本的な感情 : 怒り、期待、嫌悪感、恐れ、喜び、悲しみ、驚き、信頼 • 感情: Positive, Negative Vietsentiwordnet は 1,000 文章を含む。 レビュー文から感情を抽出する構文規則も含ま れる
  10. 16 感情解析の手法 機械学習 • 教師付き機械学習: • 「 Naive Bayes 」や「

    Support Vector Machine 」( SVM )など、トレーニングデー タとともに使用することがある。 • トレーニングの例は入手が難しいため、教師なしマシン学習: • 「 Latent Dirichlet Allocation (LDA) 」や「 word embeddings (Word2Vec) 」な どの大規模なラベル付けされていないデータセットでも使用される。 • ベトナム語では、感情解析のために機械学習を使用する論文は非常に少ない。 Source: Liu, NLP handbook, 2010
  11. 参考文献 • Opinion Mining and Sentiment Analysis Bang Liu -

    University of illinois at Chicago, Cambridge U. Press • An Introduction to Sentiment Analysis Ashish Katrekar - AVP, Big Data Analytics, GlobalLogic Inc.