トピック 1. ごちうさ難民はどこへ行ったか 2. コメントによる動画要約 3. ニコニコ動画を表現するマルチモーダル特徴の検討
ブログ記事は http://hi-king.hatenablog.com/entry/2015/05/01/220432
ニコニコ米解析@Hi_king
View Slide
@Hi_king
今日の目標
米ってどんなデータ?
本日のトピックごちうさ難民はどこへ行ったかコメントによる動画要約動画を表現するマルチモーダル特徴の検討
ごちうさ難民はどこへ行ったか?ブログ記事: http://hi-king.hatenablog.com/entry/2014/12/13/091527
この話で使う特徴動画米• テキスト• 時間• タグ• 画像• 音声• 視聴者、投稿者
なんで?なんで?(ごちうさ)
https://twitter.com/search?f=realtime&q=難民救済力%20lang:ja
ブヒリティ“ニコニコ養豚場の特徴としては、コメントの大半が「ぶひいぃぃぃ」等の豚の鳴き声で占められており…”(http://dic.nicovideo.jp/a/ニコニコ養豚場)要するに、かわいい女の子がキャッキャしてるのを眺めている我々のことである。
ブヒリティ?キルラキルはあざとい系アニメじゃないはず。。。
ブヒリティ?
強きものに屈服する豚たち。。。ぶひい、というコメントが必ずしも萌えを表すものではなかった(“服をきた豚ども!”という台詞に呼応してる)
まとめ
コメントによる動画要約
この話で使う特徴動画米• テキスト• 時間• タグ• 画像• 音声
一枚絵とagifで動画の雰囲気を観よう
ヒストグラム?
カーネル密度推定
次への課題
ニコニコの動画を表現するマルチモーダル特徴の検討
この話で使う特徴動画米• テキスト• 時間• タグ• 画像• 音声• 視聴者、投稿者全部考えてみる!
最適な特徴量?
動画 特徴量•いろんなのを結合識別器•ランダムフォレスト固定カテゴリ•アニメ、ゲーム等29カテゴリタスク
画像
画像特徴量
局所特徴量
大域特徴量
CNN
実験結果特徴量 正答率ランダム 3.48%GIST 13.18%CNN 26.43%• データ: 2876サンプル• 29カテゴリから100サンプルずつ。• ニコニコ新検索で”人気順”• 学習方法: 2776で学習、100でテストを繰り返すクロスバリデーション
CNNの混同行列
音
音特徴量
パワーの統計特徴量
周波数領域の瞬時特徴量
実験結果特徴量 正答率ランダム 7.23%音量統計量 18.81%瞬時特徴 20.69%両方 24.82%• データ: 1382サンプル• 動画の取得に結構失敗したため画像の例よりサンプルが少ない• さらに、カテゴリの割合がばらついている。• 学習方法: 1282で学習、100でテストを繰り返すクロスバリデーション
音声結合特徴の混同行列
メタデータ
動画メタデータ
ユーザーデータ
コメントテキスト
コメント特徴量の候補• 正規化済み生コメントのままつかう• Ngramに分解• 形態素解析• tfidfフィルタリングの追加
“あずにゃんペロペロペロペロ”をアニメと認識させる分解方法 分解結果生コメント あずにゃんペロペロペロペロペロペロ全く同じコメントが少ないから難しい正規化 あずにゃんペロ テンプレが認識される。けどあずにゃんじゃない対象ではだめ2gram [あず, ずに, にゃ…] “あず”や”ペロ”という特徴語が現れるので認識しやすくなる形態素解析 [あずにゃん, ペロ] 2gramより、意味を持った次元になる。ただし辞書が整ってない場合はおかしな位置で切られてしまう
Tf-IDF
今回用いた特徴1. ユニコード正規化(NFKC)2. 4文字以内の繰り返しを正規化3. 1-gramと2-gramのベクトルに分解4. 教師データ内での出現頻度上位10000次元に制限(計算資源の都合)5. tfとidfのフィルタかける
実験結果特徴量 正答率ランダム 3.45%生コメント10000次元 42.30%1gram+2gram10000次元 54.65%1gram+2gram10000次元tf-idf 57.97%• データ: 2896サンプル• 29カテゴリから100サンプルずつ。• すごい検索で”人気順”• 学習方法: 2796で学習、100でテストを繰り返すクロスバリデーション
考察
マルチモーダル
マルチモーダル特徴?
実験結果特徴量 次元数 正答率 サンプル数ランダム 7.24% 2876コメント 10000 57.97%コメント+CNN 10960 58.84%特徴量 次元数 正答率 サンプル数ランダム 3.48% 1382コメント 10000 62.42%コメント+音 10068 63.14%コメント+音+CNN 11028 63.58%
大規模データで再実験
コメント+CNNの混同行列
音楽, アニメ音楽, 歌ってみたアニメ, エンターテイメントたしかに、視聴者も近く、サムネイルも似ているものが混同しているコメント+CNNの混同行列
コメント数毎の正答率
本日のトピックごちうさ難民はどこへ行ったかコメントによる動画要約動画を表現するマルチモーダル特徴の検討@Hi_kin