質問意図によるQAサイト質問文の自動分類

質問意図によるQAサイト質問文の自動分類長岡技術科学大学林秀治　山本和英

１.背景・目的２.キーワードによる分類３.語の頻度によるスコアでの分類４.正規化したスコアでの分類

4 背景  自然文の質問により、簡単に自分の知りたい情報を得ることができるQAサイトの利用者は増加している。しかし、質問をしても回答を得られないことが多い。  回答者が答えられそうな質問を探す場合、カテゴリごとに分けて表示などは可能だが、そ
れ以外の方法で数を絞ることができない。

5 目的  質問文の難易度は質問者が求める回答の内容によって分類することができると考えた。  回答者が答えやすい質問をより簡単に見つけるための支援として、質問文を質問者の質問意図ごとに事実、根拠、提案、意見、経験の5 タイプに自動で分類する方法を提案する。

6 質問の分類  渡邊らは『コミュニティQAにおける質問の多面的評価法の検討』という研究で事実、根拠、提案、意見、経験の5種類のタイプを定義し、人手での判定を行っている。  本研究ではこの5タイプを質問文の難易度ごとの分類に使用するため、今回の目的に合わせ
て再定義し用いた。

7 質問タイプの定義  事実  答えが明確に1つに決まる質問  答えはいくつか考えられるが1つあればいい質問  自分の考えがあっているか尋ねるような質問
 とあるものについての情報を求める質問例：富士山の標高は何mですか？　エクセルで平均を出す方法を教えて　手袋は着けるであってますか？　

8 質問タイプの定義  根拠  理由や根拠についての質問例：どんぐりにはなぜ帽子がついているのですか　血液型占いの根拠はなんですか？ 
提案  ある物事のオススメについての質問例：オススメの英語勉強法はなんですか？　観光に行くならどこがお勧めですか？

9 質問タイプの定義  経験  経験に基づいた回答を求める質問例：ミニチュアダックスを飼ってらっしゃる方、　　習性や性格を教えてください。  意見
 回答者の意見やアドバイスを求める質問  アンケート形式の質問  回答する人に関する質問例：この服どう思いますか？　集中したいときどうしますか？

11 キーワードによる分類の方法  質問文に、ある特定の語（キーワード）が含まれていたとき、質問文をそのキーワードが該当するタイプに分類する。  キーワードは筆者が質問文を分類するときに、『この語があればこの分類を表している』と考えたのものを使用してた。
 複数のキーワードが1つの質問文に含まれている場合は、優先度が高いキーワードのタイプに分類される。

12 使用するキーワードとその分類事実：知りたい、方法、教えて、ますか、　　　　　ですか、でしょうか根拠：どうして、何故、なんで、根拠、由来提案：オススメ意見：どちら、あなた経験：る方

13 使用するキーワードの優先度優先度順：オススメ、知りたい、方法、どうして　　　　何故、なんで、根拠、由来、教えて　　　　ますか、ですか、でしょうか、る方『オススメを知りたい』という質問は『知りたい』よりも『オススメ』の優先度が高いので、事実ではなく提案に分類される。

14 キーワードによる分類の結果  Yahoo!知恵袋からランダムに抽出した質問文のうち、文中に一つの質問しかないと判断した1509文を自動分類した。  その結果1380文の分類に成功した。タイプ質問文数
事実 1090 根拠 113 提案 32 意見 221 経験 38 キーワード分類の精度・再現率 0 20 40 60 80 100 事実根拠提案経験意見タイプ精度・再現率精度再現率

15 考察  キーワードを多く設定できた事実は結果がよく、1つしか設定できなかった経験は結果がわるかった  提案もキーワードは1つだけだが、提案タイプの質問で全体的に見られ、その他のタイプではほとんど使用されない語のため結果は良よ
かった  より多くの語をそれぞれのタイプでの出現頻度を考慮し、分類に使用すれば結果がよくなるのでは？

17 語の頻度による分類  より多くの語を分類に使用するために、各タイプでの語の頻度で重み付けを行う以下のスコア関数を定義し用いた　　　　A=Freq(c,w)/Q_c+0.0001 　　　　B=Freq(all,c)/(ΣQ-Q_c)+0.0001 　　 Score=A/B
　　Freq(c,w)：タイプCでの語Wの出現数　　　Q_c：タイプCの質問文の数

18 語の頻度による分類の方法　質問文に含まれる語のスコアを全て足し、その合計のスコアが最も高い種類に分類される。例：世界一短い曲は何ですか？世界一 0.02939 0.00117 0.00037 0.00127
0.00173 事実根拠提案経験意見短い 0.00562 0.00039 0.00012 0.00042 0.01730 ･･･ “？” 0.00527 0.00485 0.00105 0.00511 0.00811 合計 0.07415 0.02628 0.00840 0.02601 0.05994 　この質問の場合、事実のスコアが一番高いので、事実に分類される。 + + + =

19 語の頻度による分類の結果　キーワードの分類で使用した1509文を使ってスコアを算出し、そのスコアで1509文を自動分類した語の頻度による分類の精度、再現率 0 20 40 60
80 100 事実根拠提案経験意見タイプ精度・再現率精度(スコア) 精度(キーワード) 再現率(スコア) 再現率(キーワード)

20 語の頻度による分類結果の考察  キーワードによる分類に比べ、全体的に精度・再現率ともに向上した。  事実以外の分類で精度が低いのは事実の質問が誤って分類されているためなので、事実の再現率向上が全ての分類の精度向上につながる

21 データ追加後の分類の精度、再現率 0 20 40 60 80 100 事実根拠
提案経験意見タイプ精度・再現率精度(追加後) 精度(追加前) 再現率(追加後) 再現率(追加前) データ追加後の分類の結果　スコアの計算は語の頻度を使うので、使用する質問文の数を増やした方がよりよい結果が得られると考え、データを追加し、1509文から、2938文としたタイプ質問文数事実 1967 根拠 216 提案 90 意見 500 経験 31

23 スコアの正規化  事実の誤分類が多い原因を、データが増えるほどスコアに差が出る現在のスコア関数にあると考えた  そこで、全ての分類でスコアの最大値が同じ1 になるように正規化した。

24 スコア正規化後の分類結果　スコア正規化前と同様に2938文からスコアを算出し、得られたスコアでその2938文を自動分類した。スコア正規化後の分類の精度、再現率 0 20 40 60
80 100 事実根拠提案経験意見タイプ精度・再現率精度(正規化後) 精度(正規化前) 再現率(正規化後) 再現率(正規化前)

25 スコア正規化後の結果の考察  再現率は大きな変化が見られなかったが、精度は全体的によくなった。  意見の精度のみ30ポイント近く下がった  この原因は、今までいろいろなタイプに分類されていた事実がほぼ全て意見に分類される
ようになってしまったためである。

26 事実の再現率が低い理由の調査  事実の再現率が低い原因を調べるために、各分類のスコアが上位の語を調べた。事実根拠提案意見経験
エクセル由来オススメ別れるきつく再決定下旬貴方実体験歌詞山下予算エッチ受けよ関数何故肌誘わ転換入力物入れ合い浮気まさ

27 考察  事実以外のタイプでは、該当するタイプの質問のみで全体的に出現する語のスコアが高いためその語を手がかりに分類を行うことができる  事実では、事実全体で出現しやすい語はほかのタイプの質問でも出現しやい。そのため、より多くの語にスコアを付与する必要があり、スコ
ア付与にその語が入った人手で分類済みの質問が必要な本手法では、これ以上の精度向上は困難であることがわかった。

28 まとめ  QAサイトの回答者支援として、質問文を質問意図ごとに事実、根拠、提案、意見、経験の5タイプに自動で分類する手法を提案した。  分類はキーワード、語の頻度によるスコアとそれを正規化したものを使う3つの手法で行った 
結果、スコアを正規化したものが一番結果が良かった。  しかし、事実のより正確な分類にはより多くの語のスコアが必要になるため、スコア計算に質問文のデータが必要な本手法ではこれ以上の精度向上は困難であることがわかった。

ご清聴ありがとうございました

質問意図によるQAサイト質問文の自動分類

質問意図によるQAサイト質問文の自動分類

自然言語処理研究室

More Decks by 自然言語処理研究室

Other Decks in Research

Featured

Transcript