Upgrade to Pro — share decks privately, control downloads, hide ads and more …

大規模言語モデルは誰を覚えているか / Who Do Large Language Model...

大規模言語モデルは誰を覚えているか / Who Do Large Language Models Memorize?

Avatar for Shotaro Ishihara

Shotaro Ishihara

June 08, 2026

More Decks by Shotaro Ishihara

Other Decks in Research

Transcript

  1. • LLM は新たな情報との接点となりつつあるが, 既存の検索エンジンとの差異はあまり議論され ていない • 本研究では集合的記憶に着目し,Wikipedia の 訃報記録から,複数の LLM

    に人物情報の想起を 求め,想起成功率を比較した. • LLM は訃報記録の人物を完全には想起できず, 閲覧数・職業・性別による偏りもあった.日本 語は英語より想起成功率が大幅に低かった. 2
  2. “勾配的記憶” と言える性質がある? • 紙媒体 => 選択者の意向が存在 • 検索エンジン => 文字列の二値的な

    処理 (アルゴリズム的記憶) [Esposito 17] • LLM => 訓練データに含むもの全て を暗記して出力するわけではない 7
  3. • 閲覧数 (5 群,API で取得) • 性別 (2 群,辞書による判定) =>

    英語では 10 群から 100 人ずつ, 日本語では性別判定が難しかったため 閲覧数の 5 群から 200 人ずつ 分析用の層化抽出 (各言語 1000 人) 12
  4. まとめ • LLM が集合的記憶に与える影響を議論するため Wikipedia の訃報記録から,複数の LLM に人物 情報の想起を求め,想起成功率を比較した. •

    LLM は訃報記録の人物を完全には想起できず, 閲覧数・職業・性別による偏りもあった.日本 語は英語より想起成功率が大幅に低かった. • 今後はより多角的な分析や実践的含意を展開. 19
  5. • [Halbwachs 92] Halbwachs, M.: On Collective Memory, University of

    Chicago Press (1992). • [Esposito 17] Esposito, E.: Algorithmic Memory and the Right to be Forgotten on the Web, Big Data & Society, Vol. 4, No. 1, pp. 1–11 (2017). • [石原 26] 石原祥太郎, 高橋寛武: 大規模言語モデルの訓練データ暗記の 研究動向. 人工知能学会論文誌, 41巻, 4号 (2026). • Tutuncuoglu 25] Tutuncuoglu, B. T.: Algorithmic memory: How AI is rewriting what societies choose to remember or forget, Social Science Research Network (2025). 参考文献 20