大規模言語モデル（LLM)について人文学研究者が知っておきたいこと

近藤泰弘（青山学院大学名誉教授・日本国語大辞典第三版編集委員）大規模言語モデル（LLM）について人文学研究者が知っておきたいこと

まずは使ってみる三大LLM OpenAI ChatGPT 4o, o3 Google gemini 2.5 , NotebookLM
Anthropic Claude 3.7 Sonnet

LLMの仕組み（AI自身の学習）次の単語を予測する形で学習。　〇　コナンは言った、真犯人は〈　　　〉　　　　　　　　　　　　　　　（花子だ) 　たくさんのデータを穴開けデータにして、AIに与えると、穴開けを予測できるように、そのたびに、ネッ
トワークの値を更新する。

LLMの仕組み（AI自身の推論・生成）次の単語の確率を予測する形で推論。最も確率の高い単語が出力される　〇　コナンは言った、真犯人は〈花子だ〉　〇何と、それは意外な人だった。　　　コナンは言った。真犯人は〈お前だ〉学習データにズバリの表現はなくても、文脈から生成してい
る。推理小説を生成することを考えれば、明白。

この点がLLMの重要な点〇学習する時は、次の単語を予測する形で学習するが、生成する際には、それを「オウム」のように繰り返すだけではなく、文章全体を考慮して、予測しなくてはならない＝そこに「知性」が生まれてくる。その詳しい仕組みはいまだ不明な点が多い。ここまで仕組みが不明なものを実際に活用することは、今までの人類にはない試み。

人文学研究者としてのメリット研究に活用する。翻訳・要約・論文の下案　　研究範囲の拡大・時間節約教育に活用する。TA代わり。　　教育活動の活発化

人文学研究者としてのデメリット研究　急速な変化に対応できない。何が新しいかがわからない。教育　学生がAIに頼りすぎて必要な能力を養えない。　と言って、禁止すれば、社会に出てから非常に不便。　AIリテラシーは今後必須。

人文学研究者としての方針研究　新しい状況に適応した研究が必要。学会の活用。教育　AIを使った自主的な学習に転換していく。自学自習という本来の大学生の勉強態度がさらに重要になる。AIの活用法を自分で探究することが必要。(学生の理解度を測るのが教員の責務となる）

今後の人文学の方向性 LLMとの協業による新しい学問分野の開発　研究情報をお互いに「交換」して、効率よく新しい分野を開拓する（AIのメモリ機能の活用） LLMの内部ネットワークの数値（ベクトル）を抜き出したり、分析したりする研究。AIが何を考えているかを理解して、それによって人間の脳内の活動を推測する。（AIのニューラルネットワークと、脳内のニューロンとの類似）
。

国文学/語学の研究の紹介 LLMによるコーパス検索(RAG) LLMに知識を与える方法。　　〇継続事前学習（からまる）　　〇ベクトル検索のRAG(humanitext) ネットワークの内部情報による歌風の分析

将来の人文学研究「感動」の本質を、文脈・意味だけでなく、ニューラルネットワーク上の状態として把握。脳内の活動との比較によって、「感動」とは何かを探究する。現在のLLMのフラットな言語構造では、上のような研究には限界がある。もっと違うアーキテクチャを目指して、文学・語学側からの提言をしていきたい。

ありがとうございました。ご感想などは Xアカウントへ。 yhkondo@X

大規模言語モデル（LLM)について人文学研究者が知っておきたいこと

大規模言語モデル（LLM)について人文学研究者が知っておきたいこと

Yasuhiro Kondo

More Decks by Yasuhiro Kondo

Featured

Transcript

近藤泰弘（青山学院大学名誉教授・日本国語大辞典第三版編集委員）大規模言語モデル（LLM）について人文学研究者が知っておきたいこと

まずは使ってみる三大LLM OpenAI ChatGPT 4o, o3 Google gemini 2.5 , NotebookLM

人文学研究者としてのメリット研究に活用する。翻訳・要約・論文の下案　　研究範囲の拡大・時間節約教育に活用する。TA代わり。　　教育活動の活発化

国文学/語学の研究の紹介 LLMによるコーパス検索(RAG) LLMに知識を与える方法。　　〇継続事前学習（からまる）　　〇ベクトル検索のRAG(humanitext) ネットワークの内部情報による歌風の分析

ありがとうございました。ご感想などは Xアカウントへ。 yhkondo@X