Upgrade to Pro — share decks privately, control downloads, hide ads and more …

論文紹介:HalluCitation Matters

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

論文紹介:HalluCitation Matters

一部界隈で話題になったので読んでまとめてみました.図表などは原論文からの引用です.
Yusuke Sakai, Hidetaka Kamigaito & Taro Watanabe, "HalluCitation Matters: Revealing the Impact of Hallucinated References with 300 Hallucinated Papers in ACL Conferences," arXiv (2026), [arXiv:2601.18724].

Avatar for Takahiro Kawashima

Takahiro Kawashima

March 13, 2026
Tweet

More Decks by Takahiro Kawashima

Other Decks in Research

Transcript

  1. 文献情報 [arXiv:2601.18724] HalluCitation Matters: Revealing the Impact of Hallucinated References

    with 300 Hallucinated Papers in ACL Conferences • Authors: Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe (NAIST) • Published in: arXiv (Jan. 2026) 2024-2025 年に主要な ACL 系国際会議で発表された論文を対象に, 架空の参考文献:HalluCitation を含む論文を 300 件近く同定  AI 時代の研究コミュニティへの問題提起 3 / 17
  2. 解析アウトライン 1. ACL 系会議の文献 PDF を収集 2. OCR ベースのテキスト抽出+正規化で文献情報抽出 3.

    データベースとの照合により HalluCitation 候補をフィルタリング 4. 最後は人手で精査 4 / 17
  3. データ取得 2024-2025 年の NAACL, ACL, EMNLP のチュートリアル, proceedings を除く論文が対象 

    計 17,842 本の論文 OCR ベースのテキスト抽出+GROBID による正規化で文献情報抽出  740,000 件以上の参考文献を取得 6 / 17
  4. 機械的フィルタリング ACL 系会議,arXiv,DBLP,OpenAlex のデータベースと各参考文献の タイトルを照合  正規化 Levenshtein 距離が 0.1

    以下の文献が DB になければ候補 機械的フィルタリングで約 3,000 件に絞り込み Ave./Max は 1 論文中に含まれる HalluCitation 候補の平均/最大 7 / 17
  5. 仕上げ フィルタリングされた全参考文献に対し,最後は人手で精査: 1. 基本はクリック可能なリンクや DOI,arXiv ID などに従って判断 2. それらがなければ(or 間違っていれば)Web

    検索 3.「それらしい論文」があっても,タイトル,著者,会議,ページ数のよ うな key attribute のうち 2 つ以上が合致しなければ HalluCitation と判断  かなり保守的な(基本的に HalluCitation はないと信じる)スタンス 8 / 17
  6. 主結果 HalluCitation は最近の会議ほど多い 2024 → 2025 年で明らかに増加 直近の EMNLP2025 が半数以上

    数字の読み方 𝑁𝑝 𝑞 : 𝑁(件数) ,𝑝(その Track 中の HalluCitation 割合) , 𝑞(その会議の HalluCitation のうち,その Track が占める割合) 10 / 17
  7. 分野ごとの傾向 HalluCitaion が多い分野:低リソース NLP/LLM,AI Agent 系 少ない分野:NLP 応用,解釈性,資源・評価系 HalluCited 論文がよくタイトルに含む単語:

     “Multimodal”, “Decoding”, “Quantization” あまり含まない単語:  “Human”, “Reasoning”, “Preference” HalluCited 論文はタイトルで “LLM” などと 略しがち RL 系? 14 / 17
  8. 提言(メインメッセージ) • 査読システムに HalluCitation を自動検出する機能を実装するべき • HalluCitation の定義を改めて考えるべき  今回はタイトルや

    key attribute のミスマッチで判断  同じ「引用ミス」でも罪の重さは異なり,軽微なものなら単に修正 すれば OK • 会議ベースの査読システムが限界なので,見直すべき時がきている  arXiv より速報性がなく,雑誌より厳密性の弱い会議の存在意義?  非同期の査読でジャーナルに投稿し,採択された論文を会議で発表 するスタイルを推奨 17 / 17