Upgrade to Pro — share decks privately, control downloads, hide ads and more …

講義スライドと書き起こしデータの自動対応

 講義スライドと書き起こしデータの自動対応

柿元 芳文, 山本 和英. 講義スライドと書き起こしデータの自動対応. 言語処理学会第13回年次大会, pp.688-691 (2007.3)

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 評価結果 講義 本手法 TextTiling法 講義1 0.552 0.241 講義2 0.649 0.442

    講義3 0.381 0.190 講義4 0.378 0.243 講義5 0.600 0.300 全体 0.543 0.326 適合率 Pw 表1:講義別にみた適合率 本手法がTextTiling法を上回っている
  2. 考察 講義 含有率 講義1 0.434 講義2 0.613 講義3 0.416 講義4

    0.478 講義5 0.408 表2:スライドの単語の含有率 含有率に大きな差が見られない スコア計算に採用した単語に問題がある
  3. 含有率スコア        (1/2) k W k W i W k W i

    W R | | ) , ( ' ∩ = } ) 1 ( ) ( | {  M i s J j j H w w k W − = ∈ = (1) ) , ( k W i W R i:スライド番号 j :発話ID M:発話の総数 ) ( j H :発話IDが  の場合の発話 j i W:スライドの単語の集合 k W :ある範囲の発話群に含まれる単語の集合 ) (i j s :分割点の発話ID w:1単語
  4. 含有率スコア        (2/2)        ≤ ×

    = otherwise k W i W R k W if k W k W i W R k W i W R ) , ( ' 100 | | 100 | | ) , ( ' ) , ( 式(1)(2)より 傾向1に沿ったスコア (2) ) , ( k W i W R
  5. 動的計画法 } ) ' ( | { ) ' (

    ) , ( ) | ( 1 ) 1 ( ' ' ' ' ) 1 (  + + − − = + ∈ = + = i N M i J j k k i j i ij s j H w w W j L W W R S S Score ij S ' ) 1 ( j i S + から に移動する場合のスコア N :スライドの枚数 ' j :直前のステートから接続可能な発話ID