Upgrade to Pro — share decks privately, control downloads, hide ads and more …

放送コンテンツに対する ツイートの<一様率>分析

iota
March 05, 2023

放送コンテンツに対する ツイートの<一様率>分析

DEIM2023 Day1 4a-3-2にて発表したスライドです

iota

March 05, 2023
Tweet

More Decks by iota

Other Decks in Research

Transcript

  1. 奈良先端科学技術大学院大学              ◦太田 暢, 若宮

    翔子, 荒牧 英治 放送コンテンツに対する ツイートの<一様率>分析 DEIM2023 Day1 4a-3-2 (Short) 1/26
  2. ツイート 分散表現 類似度 一様率 [ 0.03947302, -1.1532444 , -0.6916176 ,

    ...] 0.54416495, 0.25739207, 0.16123542, … 0.5275498 <一様率>のアイデア 11
  3. 関連研究 12 ・共感とは他人の考えや感情を理解する能力 [Decety+, 2004] ・共感の理解には自然言語からの検出モデルや,質の高いラベル付きデータが   必要となり,アノテーションコストが大規模になる [Hosseini+, 2021]

    →基準を共感まで拡大することによるコストを考慮し,学習に必要なモデルの   提示ではなく,汎用性が高い教師なし学習により共通点を提示 Decety J, Jackson PL. The functional architecture of human empathy. Behav Cogn Neurosci Rev. 2004 Jun;3(2):71-100. doi: 10.1177/1534582304267187. PMID: 15537986. Mahshid Hosseini and Cornelia Caragea. 2021. Distilling Knowledge for Empathy Detection. In Findings of the Association for Computational Linguistics: EMNLP 2021, pages 3713–3724, Punta Cana, Dominican Republic. Association for Computational Linguistics.
  4. 意味的類似度の算出フロー 13 2022-12-18 02:33:02,93さんはベシャリの芸人 #annkw 2022-12-18 02:33:06,93さんさんの言う事がイチイチ正しいんだよなぁ … w #annkw

    2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 #annkw 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミン… クミさんから言われなかったことで失念 #annkw ...
  5. 意味的類似度の算出フロー 14 2022-12-18 02:33:02,93さんはベシャリの芸人 #annkw 2022-12-18 02:33:06,93さんさんの言う事がイチイチ正しいんだよなぁ … w #annkw

    2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 #annkw 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミン… クミさんから言われなかったことで失念 #annkw ... 2022-12-18 02:33:02,0さんはベシャリの芸人 2022-12-18 02:33:06,0さんさんの言う事がイチイチ正しいんだよなぁw 2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミンクミさんから言われなかったことで失念 ... STEP1. 文字の置換・削除
  6. 意味的類似度の算出フロー 15 2022-12-18 02:33:02,93さんはベシャリの芸人 #annkw 2022-12-18 02:33:06,93さんさんの言う事がイチイチ正しいんだよなぁ … w #annkw

    2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 #annkw 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミン… クミさんから言われなかったことで失念 #annkw ... 2022-12-18 02:33:02,0さんはベシャリの芸人 2022-12-18 02:33:06,0さんさんの言う事がイチイチ正しいんだよなぁw 2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミンクミさんから言われなかったことで失念 ... 2022-12-18 02:33:02, vector_1 2022-12-18 02:33:06, vector_2 2022-12-18 02:33:58, vector_26 2022-12-18 02:33:58, vector_27 ... STEP1. 文字の置換・削除 STEP2. 分散表現獲得 (word2vecを採用)
  7. 意味的類似度の算出フロー 16 2022-12-18 02:33:02,93さんはベシャリの芸人 #annkw 2022-12-18 02:33:06,93さんさんの言う事がイチイチ正しいんだよなぁ … w #annkw

    2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 #annkw 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミン… クミさんから言われなかったことで失念 #annkw ... 2022-12-18 02:33:02,0さんはベシャリの芸人 2022-12-18 02:33:06,0さんさんの言う事がイチイチ正しいんだよなぁw 2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミンクミさんから言われなかったことで失念 ... 2022-12-18 02:33:02, vector_1 2022-12-18 02:33:06, vector_2 2022-12-18 02:33:58, vector_26 2022-12-18 02:33:58, vector_27 ... STEP1. 文字の置換・削除 STEP2. 分散表現獲得 (word2vecを採用) STEP3. リスト化 2022-12-18 02:33:00,"[vector_1,vector_2, ... ,vector_26,vector_27]"
  8. 意味的類似度の算出フロー 17 2022-12-18 02:33:02,93さんはベシャリの芸人 #annkw 2022-12-18 02:33:06,93さんさんの言う事がイチイチ正しいんだよなぁ … w #annkw

    2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 #annkw 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミン… クミさんから言われなかったことで失念 #annkw ... 2022-12-18 02:33:02,0さんはベシャリの芸人 2022-12-18 02:33:06,0さんさんの言う事がイチイチ正しいんだよなぁw 2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミンクミさんから言われなかったことで失念 ... 2022-12-18 02:33:02, vector_1 2022-12-18 02:33:06, vector_2 2022-12-18 02:33:58, vector_26 2022-12-18 02:33:58, vector_27 ... STEP1. 文字の置換・削除 STEP2. 分散表現獲得 (word2vecを採用) STEP3. リスト化 2022-12-18 02:33:00,"[vector_1,vector_2, ... ,vector_26,vector_27]" STEP 4 . 文 章 類似度の算出 ( コサイン 類似度を採用) 2022-12-18 02:33:00,"[ simil ar i t y _1, simil ar i t y _2, ... , simil ar i t y _350, simil ar i t y _351]"
  9. <一様率>の定義 22 2022-12-18 02:33:02,93さんはベシャリの芸人 #annkw 2022-12-18 02:33:06,93さんさんの言う事がイチイチ正しいんだよなぁ … w #annkw

    2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 #annkw 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミン… クミさんから言われなかったことで失念 #annkw ... 2022-12-18 02:33:02,0さんはベシャリの芸人 2022-12-18 02:33:06,0さんさんの言う事がイチイチ正しいんだよなぁw 2022-12-18 02:33:58,言われたことはやるが言われてないことはやらない受取師の性 2022-12-18 02:33:58,子供用の荷物のリュックを忘れたカスミンクミさんから言われなかったことで失念 ... 2022-12-18 02:33:02, vector_1 2022-12-18 02:33:06, vector_2 2022-12-18 02:33:58, vector_26 2022-12-18 02:33:58, vector_27 ... STEP1. 文字の置換・削除 STEP2. 分散表現獲得 (word2vecを採用) STEP3. リスト化 2022-12-18 02:33:00,"[vector_1,vector_2, ... ,vector_26,vector_27]" STEP 4 . 文 章類似度 の 算出 ( コサイン類似度 を採用) 2022-12-18 02:33:00,"[ simil ar i t y _1, simil ar i t y _2, ... , simil ar i t y _350, simil ar i t y _351]" 平均値 avera g e = 0.37025777
  10. 番組の面白さと一様率の関係 23 3番組の音源の一部を使用 被験者の1分ごとの主観的面白さスコア 4段階のリッカート尺度 音源 番組名 ジャンル 放送日時 使用時間

    ハッシュタグ 1 赤江珠緒たまむすび バラエティー,アナウンサー 2022/1/20~13:00〜15:30 27分間 #tama954 2 THE TRAD 音楽,ミュージシャン 2022/1/24~15:00〜16:50 15分間 #THETRAD 3 オードリーのオールナイトニッポン トーク,芸人 2022/1/16~ 1:00〜3:00 19分間 #annkw
  11. 太田暢, 村山太一, 矢田竣太郎, 荒牧英治, and 若宮翔子.Twitter を用いたラジオ番組圧縮手法の提案. 第 14 回データ工学と情報マネジメントに関するフォーラム

    (C21-2),2022 面白さスコアと (参考) [太田+, 2022] ツイート数 24 深夜トーク番組 昼間情報番組 面白いと感じてから 1~2分後にツイート数に 反映される 夕方音楽番組