エンジニアは生成AIとどのように向き合うべきか？ことばの意味という観点から

エンジニアは生成AIとどのように向き合うべきか？ことばの意味という観点から東京大学　理化学研究所谷中　瞳 http://hitomiyanaka.strikingly.com/ [email protected] X: @verypluming Qiita
Conference 2026 1

自己紹介東京大学大学院　情報理工学系研究科コンピュータ科学専攻　谷中研究室　准教授（卓越研究員）理化学研究所　革新知能統合研究センター説明可能AIチーム　チームディレクター研究分野：自然言語処理、計算言語学経歴 2018-2021 理化学研究所革新知能統合研究センター　特別研究員
2015-2018 東京大学大学院工学系研究科システム創成学専攻　博士(工学) 2

宣伝：「ことばの意味を計算するしくみ」・ことばの意味を形式的にとらえる　計算言語学・ことばの意味を統計的にとらえる　自然言語処理ことばの意味を計算する2つのアプローチの可能性と課題を整理 2026年ITエンジニア本大賞技術書部門受賞！ https://x.gd/Y13JK 3

生成AIを活用した開発業務の効率化が急速に普及代表例（ごくごく一部） • コーディング支援 ◦ GitHub Copilot、Claude Code、Gemini CLI、Codex CLIなど
• テキスト生成 ◦ チャットボット、文書校正、機械翻訳、情報検索など • 画像生成 ◦ デザインプロトタイプ作成、コンテンツ制作支援など 4

生成AIを活用した開発業務の効率化が急速に普及代表例（ごくごく一部） • コーディング支援 ◦ GitHub Copilot、Claude Code、Gemini CLI、Codex CLIなど
• テキスト生成←今日はこちらを中心に話します ◦ チャットボット、文書校正、機械翻訳、情報検索など • 画像生成 ◦ デザインプロトタイプ作成、コンテンツ制作支援など 5

LLM：テキスト生成に特化した生成AI 2023年頃からChatGPTをはじめとして、大量のテキストと深層学習を用いて統計的にことばを学習する大規模言語モデル(LLM) が急速に発展 6 図は[Minaee+2024]から引用

本日は、以下の順に紹介します 1. LLMの基本的なしくみ 2. LLMのしくみからわかる課題 3. LLMの課題を踏まえた活用方法 4. 今後、LLMとどのように向き合うと良いか 7

LLMはそもそもどのようにことばの意味を捉えている？ LLMは語の分布に基づいてことばの意味を捉えている（分布意味論）語の意味は周囲の語（文脈）から形成されるという分布仮説に基づいて、語の意味をベクトルで記述天気という語は今日という語と同時に出現しやすい：語の意味をその語の周囲に現れる語の出現頻度に基づいて表す今日の天気は晴れである。今日の1時間ごとの天気、気温、降水量を掲載します。あなたが知りたい天気予報をお伝えします。
今日は天気が良いので布団を干した。 8

どうやって単語の意味を表す？(1)：one-hotベクトル文を一定の区切り（トークン）で分割し、各トークンにID（次元）を振り、one-hot ベクトル（局所表現）にする今日(1,0,0,0,0,0,0)　　　　　今日 (1,0,0,0,0,0,0) は (0,1,0,0,0,0,0)　　　　　は (0,1,0,0,0,0,0)
晴れ(0,0,1,0,0,0,0)　　　　　休み (0,0,0,0,0,1,0) て (0,0,0,1,0,0,0)　　　　　だ (0,0,0,0,0,0,1) いる (0,0,0,0,1,0,0) 今日は晴れている 1 2 3 4 5 今日は休みだ 1 2 6 7 9 トークン ID ※トークンの区切り方は複数通り考えられることに注意（例：「て　いる」と「ている」）モデルによって異なる

どうやって単語の意味を表す？(2)：単語の分散表現局所表現は非常に高次元になり計算効率が悪いので、分散表現にする：単語埋め込みベクトルhをone-hotベクトルxに変換⾏列Wをかけて得る h=Wx - Wは埋め込み行列、コーパス（テキストの集合）から学習 - xの次元はコーパス中のトークン数 - hの次元は埋め込みたい数（ハイパーパラメータ）
- 例）Llama3.1-8B-Instructの埋め込み次元数は4096 10

単語の意味から文の意味を計算する：言語モデルトークン系列w 1 , w 2 ,…,w i-1 の次に続くトークンw i
の出現確率（確からしさ）P(w 1 , w 2 ,…,w i )を計算するモデル　　　　P(今日,の,天気,は,GPT)=0.0000003 　　　　P(今日,の,天気,は,パンダ)=0.0000007 　　　　P(今日,の,天気,は,晴れ)=0.0000127 出現確率が高い文を自然な文として生成するように学習　　　　→今日,の,天気,は,晴れ 11

大規模言語モデルの根幹にあるモデル：Transformer [Vaswani+2017] 12 Encoder Attentionに基づくEncoder-Decoder （系列変換）モデル • Attention : 入力系列の重要な情報（どの単語に注目するか）
を用いるしくみマルチヘッドで並列処理可能、LLMの誕生へ • Encoder-Decoder : 入力系列を1つの埋め込みベクトルに変換する Encoderモデルと、 Encoderのベクトルを受け取り1トークンずつ生成するDecoderモデルから構成 Decoder

GPT (Generative Pre-trained Transformer) [Radford+2018] 元祖・大規模なコーパスによる事前学習に基づく大規模言語モデル TransformerのDecoder部分を用い、トークン列の次に続くトークンの確率を計算：Transformerがことばの深い再帰、局所曖昧性、長距離依存関係にある程度頑健になったので、高性能で確率を計算できる 13
図は[Devlin+2019]から引用

GPT-3：現在のChatGPTの前身[Brown+2020] • OpenAIが開発したLLM • 基本構成はGPTと同じだが、事前学習に用いるデータサイズやパラメータ数が桁違いに大きい ◦ 570GBのテキストデータで事前学習、パラメータ数は175B ◦ LLMの性能は基本的には計算資源・データサイズ・パラメータ数が多いほど良
い[Kaplan+2020] • GPT-3以降のLLMは、タスクの説明と少数の正解例をプロンプトとして入力に含めれば、ある程度タスクに適応できる（文脈内学習） • 現在のLLMは事前学習に加えて指示チューニング（プロンプト遵守率を高める追加学習）、思考過程の生成を促す追加学習なども実施 14

LLMの課題1：分布仮説に起因する問題否定、量化、数量、時制、比較、代名詞など、文法が関わる意味は、分布仮説に従うとは限らない 15 機械翻訳の例日本語：私は泳げなくないわけではない英語：Not that I can't
swim. 複雑な構文になると、入力の認識や出力の生成を誤ることがある「喫煙席のないカフェ」で検索したのに、喫煙席のあるカフェばかり出てくる… 情報検索の例

LLMの課題2：解釈性・説明性 LLMは入力から出力に至るまでの過程がブラックボックス、どのようにことばの意味をとらえているのか解釈し説明することが難しい、事前学習データから思わぬバイアスを学習している可能性も 16 入力：「私は泳げなくないわけではない」と発言した話者は泳げますか？出力：
話者は泳げます

LLMの課題をふまえたLLMの活用方法(1)プロンプト • LLMにどういうタスクをやってもらいたいのか、単純な語・構文・構造で、曖昧さを残さずに、具体的に書こう ◦ 複数の意味を持つ語、否定、指示語の多用など、複雑な構文になるとハルシネーション（幻覚）を起こしやすい[Watson+2026] ◦ 悪い例：あのスピードについて教えて「あの」は何を指す？「スピード」は映画？トランプのゲーム？
◦ タイポや無駄な空白も、性能に影響を与える[Romanou+2026] ◦ プロンプト最適化を使用する場合も、結局初期のプロンプト設定が重要 • LLMの学習データの多くは英語であることを考慮しよう ◦ LLM内部では英語で思考しているという研究も[Zhong+2024] ◦ 日本語ではなく英語で聞いた方が正しい場合もある(ただし、複数言語が混在するコードスイッチングクエリは悪化する場合もある[Zeng+2026]) 17

LLMの課題をふまえたLLMの活用方法(2)タスク設定 • なるべく単純なタスク設定にしよう ◦ 人間が解けないタスクは、基本的にはLLMも解けない ◦ 1つのプロンプトで複数のタスクを聞かない（エージェントを分ける） • タスク設定やプロンプトが適切か、テストデータで確認しよう
◦ 実際に頻出するデータと、例外的なデータの両方でテスト ◦ 適切なfew-shot example、参考URLなどエビデンスを与えると効果的 • タスクの背景、ロール、ペルソナをシステムプロンプトで明確に ◦ 例：あなたは社内チャットボットを開発しているエンジニアです ◦ ただし、複数の背景を与えると、部分的にしか考慮してくれない場合も • タスクに合った出力形式を指定しよう ◦ 長い文字数の遵守は苦手例：2000字でLLMとは何か説明して 18

LLMの課題をふまえたLLMの活用方法(3)人間のチェック • LLMのバイアスやハルシネーションの問題は原理的に避けられない。プロンプトインジェクションや情報漏洩などの安全性の問題も ◦ プロンプトインジェクション：悪意のあるプロンプトを入力してシステムプロンプトを引き出すなどの不正な挙動を誘発する攻撃 • RAG (Retrieval-Augmented
Generation) による事実照合やガードレールモデルなど、データや用途に合わせて技術を使い分けよう ◦ 大規模データの高速な照合はベクトル検索型RAG、流動データの照合はエージェント型RAG、入力のフィルタリングはガードレールモデル • 人間ーモデル間の効率的なチェック体制( human-in-the-roop) を考えることも重要 ◦ ハーネスエンジニアリング 19

今後、LLMとどのように向き合うと良いか 20 • LLMは様々な業務の効率化に活用できるようになったが、どういうタスクを解いてもらいたいのかをことばで正確にLLMに伝える力が求められている • LLMと向き合う力は、PM力とも少し近い？ ◦ 役割・仕事内容・制約を正確にわかりやすく伝える ◦
仕事内容が問題ないか効率的に人手でチェックするしくみを考える ◦ ただし、図でLLMに意図を伝えることは（現状）難しい。また、人に意図を伝える場合は表情や感情など、非合理な部分も大切といった違いがあることにも注意 • LLMを効果的に活用して、効率的に業務を進めようご清聴ありがとうございました！

エンジニアは生成AIとどのように向き合うべきか？ことばの意味という観点から

エンジニアは生成AIとどのように向き合うべきか？ことばの意味という観点から

Hitomi Yanaka

More Decks by Hitomi Yanaka

Other Decks in Technology

Featured

Transcript