Upgrade to Pro — share decks privately, control downloads, hide ads and more …

卯月コウの配信 メンバーの方がコメント辛辣説 修正

卯月コウの配信 メンバーの方がコメント辛辣説 修正

【統計学】卯月コウの配信 メンバーの方がコメント辛辣説 修正版【夜須田舞流の世界一役に立たない授業】
https://youtu.be/YWxYzWAlbRA

57169a9f8294dd5410d1457e55cc8178?s=128

MairuYosuda

March 27, 2021
Tweet

Transcript

  1. 検 証

  2. はじめに •前回メンバーと一般視聴者でコメントの傾向が異なるかを 検証しましたが、検証方法に問題があるという指摘を受 けたので再検証しました。 •主な結果としてメンバーの方が「は?」「すぞ…」といっ たコメントをしている率が高いこと、またメンバーと一般視 聴者で「草」と「w」の使用率に差異があることが分 かりました。

  3. こんな指摘をいただきました “総コメント数を見ると一般視聴者・メンバーで、108万・80 万と1.3倍ほどしか違わない。 総視聴者の半分近くがメンバーとは思えないので、メンバーは全 般的にコメント数が多いものと推測できる。 「…すぞ」や「は?」をコメントするタイミングは配信中で限定 されると思うので、比率で見るとメンバーでは希釈されて低くなる のでは? “ →おっしゃる通りでした……

  4. 再検証してみました! • 卯月コウが2020年に行った配信にされたコメント (全1887732コメント)を各配信、各ユーザー毎に整理。 例)「【 ToHeart2】今年最後の大恋愛2020 その①【にじさんじ/#おり コウ】」という配信で「◦◦」というユーザーは「草 は? ゲーム音デカイ」とい

    うコメントをしている。など 目的変数:各ユーザーが1配信の中で特定のコメントをしているかどうか 上の例だと「草」は「1」、「ジジイがよ」は「0」になるようなダミー変数 説明変数:コメント数、メンバーかどうか →ロジスティック回帰で分析!
  5. なぜ説明変数にコメント数を入れたのか? • 今回調べたいのは メンバーかどうか→特定のコメントをしているか ただし、こんな事も考えられる • コメントを多くする人のほうがメンバーに入りやすい • コメントを多くする人のほうが 特定のコメントをしている割合も高い

    →交絡因子として処理しなければいけない! 特定のコメント をしているか 配信内における コメント数 メンバーか どうか
  6. 分析結果 は? すぞ… ジジイがよ 草 w coef EXP(β) coef EXP(β)

    coef EXP(β) coef EXP(β) coef EXP(β) メンバー 0.443*** 1.558 0.137* 1.147 -0.189 0.827 0.392*** 1.480 -0.241*** 0.786 (0.023) (0.080) (0.181) (0.014) (0.021) コメント数 0.030*** 1.031 0.013*** 1.013 0.011*** 1.011 0.083*** 1.086 0.030*** 1.031 (0.000) (0.000) (0.001) (0.001) (0.000) 定数項 -3.366*** 0.035 -5.643*** 0.004 -7.016*** 0.001 -1.315*** 0.269 -2.702*** 0.067 (0.015) (0.047) (0.094) (0.008) (0.012) 注)( )内は標準誤差を示す。また***,**,*は、それぞれ1%,5%,10%有意水準を示す • は?……「は?」 • すぞ…… 「…すぞ」or「・・・すぞ」 • ジジイがよ……「ジジイがよ」or「ジジィがよ」or「じじいがよ」or「じじぃがよ」 • 草……「草」 • W……「W」
  7. 分析結果② • メンバーの方が「は?」「すぞ…」といったコメントをする率が高い。 • 「ジジィがよ…」に関してはメンバーかどうかによってコメントをする率に差は 有意に見られない。 • メンバーの方が「草」を、一般視聴者の方が「W」を使用する率が高 い。

  8. 検証結果 みんなコウのことを 「ジジイ」だと思ってる。

  9. 感想 • 前回と今回で検証結果がほぼ逆になっています。 →データをきちんと確認して正しい検証方法を選択しないと誤った結論を 導いてしまう。 • 論文の「査読」というものの必要性を感じました。ただし、ドメイン知識 に関しては査読者が必ずしも持っているものではなく、p-hackingなども あるので「1つの論文」だけを鵜呑みにするのは危険。