Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20260617_学術バーQ(計算社会科学)

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for Kazuhiro Ito Kazuhiro Ito
June 16, 2026
7

 20260617_学術バーQ(計算社会科学)

Avatar for Kazuhiro Ito

Kazuhiro Ito

June 16, 2026

Transcript

  1. ⚫ 名前:伊藤和浩(いとう・かずひろ) ⚫ 出身:東京都武蔵野市 ⚫ 所属:東大鳥海研(特任研究員) ⚫ 経歴: - 学部:早稲田大学文化構想学部(2011-2015)

    - 求人広告の広告代理店(2015-2021) - 修士:奈良先端科学技術大学院大学(2021-2023) - 博士:奈良先端科学技術大学院大学(2023-2026) ⚫ 興味分野:人(々)独自の言語使用が心理や振る舞いに与える影響 自己紹介 2
  2. 定量的に言葉を「読む」 • 日本人のオンライン・コミュニ ケーション上での平均使用語彙数 は8,000語 • 約2.5億件のTweetを分析 荒牧 et al.

    “日本人のオンライン・コミュニケーション上での平 均使用語彙数は8,000語である”. 研究報告 自然言語処理 (2012). 人数 語彙数 5
  3. 定量的に言葉を「読む」 • 語義の変化は定量化できる • 頻出語ほど変わりにくい • 多義語ほど変わりやすい • 英・仏・独・中国語の 大規模書籍データ:

    英語のデータのみで 約8,500億語,10万語の本に 換算すると約850万冊分 Hamilton et al. “Diachronic Word Embeddings Reveal Statistical Laws of Semantic Change”. ACL (2016). 6
  4. 計算機が言葉を「読む」には? 1. トーカナイズ:多くの場合,最初に語の単位に分ける (近年の自然言語処理ではより細かい単位に分けることが主流だが,社会分析では語の単位もまだ有効) (日本語や韓国語,中国語などではこれが難しい) 2. 定量化: • 頻度分析:単語,フレーズ,記号などの数え上げも重要な発見になりうる •

    辞書分析:語と概念(感情など)を結びつけた辞書を用いて,概念のスコアを測る • トピックモデル:テキスト集合の背後にいくつかの「トピック」があるという仮定のもと, トピックごとに出現確率の高い語を生成(e.g. LDA, STM, BERTopic, KeyATM) • 埋め込み表現(ベクトル化):テキストを数値の行列に変換 7
  5. ケース1:Tweetは最良の緊急地震速報にな りうるか? Sakaki et al. “Earthquake Shakes Twitter Users: Real-time

    Event Detection by Social Sensors”. WWW (2010). • 地震が起こると 「地震!」「揺れてる」 などみんながツイート • 有用な情報共有のために 活用できないか? 10
  6. ケース1:Tweetは最良の緊急地震速報にな りうるか? 手法 1. 地震発生と関連するツイートの特定: 1. キーワード(「地震」、「揺れ」等)を含むツイートを取得 2. 取得ツイート群の統計的情報(文字数、キーワードの位置)、単語、文脈(キー ワード前後の単語)を特徴量とした、自動分類モデルを作成

    2. 地震発生の判定:n個の地震関連ツイートが「全て誤検知である確率」を求 め続け、実際に地震が発生した確率が95%を超えたら「地震発生」とする 3. 発生位置の推定:ツイート群の位置情報から震央を推定 12
  7. ケース2:Tweetはインフルエンザ流行を早 く・正確に検出できるか? Aramaki et al. “Twitter Catches The Flu: Detecting

    Influenza Epidemics using Twitter”. EMNLP (2011). • インフルエンザの流行をTweetから検出 • 多くの国家にはインフルエンザの流行を モニタリングする機関があるが、 流行→報告までに1〜2週間のタイムラグ 14
  8. • 最も有名なインフル流行検出手 法:Google検索語からの検出 [Ginsberg+`09] • 革新的だが、3つの限界: • 検索行動とインフル疾患の関係の変 化に弱い •

    アルゴリズムが変わると劣化 • Googleしかデータを利用できない ケース2:Tweetはインフルエンザ流行を早 く・正確に検出できるか? https://medium.com/@nandana5434/the-epic-rise-and-fall-of-google-flu- trends-what-it-teaches-us-about-data-mining-hype-f2683064439c https://blog.fabric.ch/index.php?/archives/297-Google- Flu-Trends-Tracking-Flu-across-the-U.S..html 15
  9. ケース3:隣の芝は青い Giorgi et al. “Well-Being Depends on Social Comparison: Hierarchical

    Models of Twitter Language Suggest That Richer Neighbors Make You Less Happy”. ICWSM (2021). • イースタリンの逆説 [Easterlin`74]: 国内の収入と幸福度は比例するが、 国全体が豊かになっても 人々の幸福度は上昇しない • 相対的な収入と幸福度の関係を ビッグデータで検証 20
  10. ケース3:隣の芝は青い • 地域内で周囲よりも相対的に貧しい人々 は、以下の語が頻出: • 罵倒:fck, sht, b*tch, idiot •

    怒り:bullsht, wtf, hate, grr • 混乱:anymore, idk, confused • 薬物・アルコール:weed, drunk, smoke • 若者言葉:homework, school, soooo, omfg 23
  11. ケース4:空気が読めるチームはうれしい Ito et al. “Social harmony at work: A sharedness

    index linking team atmosphere to individual well-being in a Japanese company”. PLOS ONE (2025). • 「みんなの雰囲気が良いか?悪いか?」の認識がメンバー間で一致するチームは, 幸福感が高い?(社会的調和という心理的概念) 24
  12. ケース5:使う語彙が居場所を決める Danescu-Niculescu-Mizil et al. “No country for old members: user

    lifecycle and linguistic change in online communities”. WWW (2013). • コミュニティ全体の言語表現 は常に変化 • 個人個人の言語表現も、 順応して変化する? • 言語的な順応と、 コミュニティ参加の関係は? 30
  13. 手法 • データ:2つのビール評価サイトの全レビュー(1.5M+, 2.9M+) • コミュニティの言語モデル:各月の一部のデータを学習させ、与えられ た2語の組み合わせの出現確率を出すモデルを構築 • ユーザの、言語変化への適応の指標: •

    言語の柔軟性:現在の投稿と過去10回投稿との間の語彙重複度 • 言語の進歩/保守性:投稿が、過去・未来のコミュニティ言語のどちらと近いか • 新語彙採用率:最近複数のユーザによって使われた新語彙の使用率 ケース5:使う語彙が居場所を決める 31
  14. ケース6:独自な語義がコミュニティを作る 出現頻度 文脈的多様性 https://en.wikipedia.org/wiki/Nintendo • 独自な言語使用が多いコミュニティ ほど集団的アイデンティティが強い? • 独自な言語使用を,「出現頻度」と 「使用文脈の一様性」により定義

    • 任天堂のwikiの例(右図) • “seal”は,品質を保証する”Nintendo Seal of Quality”を指す文脈のみ • “console”は,ゲーム機全般を指す 中央値 中央値 独自な言語使用! 34
  15. おわりに:まだまだ言葉で社会を読みたい • 独自な言葉は集団の活動を促進 • 言葉は思考 [Vygotsky1986] や社会関係 [Bourdieu1984] を動かす力をもつ •

    心理学や社会学の課題に対して自然言語処 理技術を用い,介入により社会的つながり を促進したい Vygotsky. Thought and Language. MIT Press, 1986. Bourdieu. Distinction: A Social Critique of the Judgement of Taste. Harvard Univ. Press, 1984. 37