Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介:Language Model Inversion
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Toma Tanaka
December 18, 2023
Technology
330
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
論文紹介:Language Model Inversion
Toma Tanaka
December 18, 2023
More Decks by Toma Tanaka
See All by Toma Tanaka
2026年度 人工知能学会全国大会「AIおよび機械学習分野における継続運用のための 自動研究システムの開発」
fuyu_quant0
3
760
AI研究の自動化に向けたOSSの開発
fuyu_quant0
0
180
大規模言語モデルの論理構造の把握能力と予測モデルの生成
fuyu_quant0
0
240
Evolutionary Optimization of Model Merging Recipes
fuyu_quant0
4
2.8k
Inductive-bias Learning: 大規模言語モデルによる予測モデルの生成
fuyu_quant0
0
260
Solving olympiad geometry without human demonstrations
fuyu_quant0
4
760
量子コンピュータとデータサイエンティスト
fuyu_quant0
0
470
スライド用GPTを使った 「量子コンピュータ」の スライド作成
fuyu_quant0
0
35k
Other Decks in Technology
See All in Technology
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
160
スキルと MCP ツール、責務をどう分けるか? AI が迷わないインターフェース設計の戦略
cdataj
1
1.1k
脱SaaS!FDEを支えるプロビジョニングと分離設計
knih
0
240
AWS Security Agent といっしょに脅威モデリングをやってみよう
amarelo_n24
0
160
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
280
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
140
AI時代のコスト管理を考えよう〜明日から使える実践AWSノウハウ~
yoshimi0227
0
220
【2026年版】 ベクトル検索とEmbedding最前線
mocobeta
14
3.7k
AIはどのように 組織のアジリティを変えるのか?
junki
4
1k
GitHub Copilot 最新アップデート – 「一歩先」の実践活用術
moulongzhang
4
1.5k
OTel × Datadog で 「AI活用」を計測し、改善に繋げる
shihochan
0
280
作って終わりにしない タイミーのセマンティックレイヤー育成の現在地
chanyou0311
4
2.5k
Featured
See All Featured
The Pragmatic Product Professional
lauravandoore
37
7.3k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.7k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
180
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
440
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
420
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
340
Utilizing Notion as your number one productivity tool
mfonobong
4
320
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
How to make the Groovebox
asonas
2
2.2k
Transcript
田中 冬馬
株式会社ブレインパッド データサイエンティストとしてマーケティング分析,広告文の自動生成などの自然 言語処理の業務に従事 Autores 松尾研究室の研究の自動化プロジェクト その他の活動 LLM 関連で論文執筆 Inductive-bias Learning:
Generating Code Models with Large Language Model Data Science wiki データ分析手法,AI 関連の技術に関する民主化を目指しているサイトの作成 Qiita の執筆 LLM のプロンプト技術まとめ 自己紹介
LLM Input Output 論文紹介:Language Model Inversion 論文:https://arxiv.org/abs/2311.13647 LLM の出力から入力プロンプトを復元する技術 復元
LLM とは Large Language Model( 大規模言語モデル) のこと Transoformer というアーキテクチャが使われているディープラーニングのモデル であり,ChatGPT
のサービスで使われているGPT-4 やGPT-3.5-turbo などの総称
私 は AI で す LLM の入出力 LLM のベースは Transformer
decoder
私 は X1 x2 x3 p(x1 |私,は) = 猫 天才
だ で す AI し を ・ ・ ※厳密に条件付き確率を計算しているわけではなく 確率値を返すような関数を近似したものです の中身の合計は1 ( 確率なので) 0.001 0.0004 0.0...1 0.0...3 0.0...4 0.01 0.0...2 0.0...7 ・ ・ ← 最も高い はモデルが出力で きる全トークン数 のベクトル ※ トークン... 文章を分割する際の最小単位 (LLM を作成する際に決めている) ※GPT-4 は約50,000 のトークン数で表現 BPE という手法を使っている
私 は AI x2 x3 p(x2 |私,は,AI) = 猫 天才
だ で す AI し を ・ ・ 0.0...8 0.0...5 0.0001 0.003 0.0...4 0.0...1 0.0...2 0.0007 ・ ・ ← 最も高い
私 は AI で x3 p(x3 |私,は,AI ,で) = 猫
天才 だ で す AI し を ・ ・ 0.0...2 0.0...1 0.0...1 0.0...3 0.004 0.0...6 0.002 0.0..7 ・ ・ ← 最も高い
私 は AI で す LLM は確率分布を出力し 最も確率値が高い言葉( トークン) を選び続けて文章生成が行われる
→入力された文章の情報が確率分布に残されていれば復元できる ※ 温度パラメータが0 の場合 最も確率値が高いもの以外を選ぶ方法もある
機械学習を勉強するのが好き LLM 確率分布 です 機械学習を学ぶのが好き LLM 確率分布 です 検証 異なるか
文章の一部を類似している言葉に置き換えLLM に入力した時の確率分布を比較する
KL ダイバージェンス... 確率分布全体の形状はそこまで差がない 似ている文章を入力しているため当然 ハミング距離... 何単語後も正確に確率分布が一致しているわけではない 最初の入力の違いがずっと伝播している 確率分布のKL ダイバージェンスとハミング距離を比較 検証
確率値から文章を復元するモデルを学習 確率分布の数値から文章を再現するモデルを学習( 赤い部分) モデルのベースはT5 を使ったそうです
実験結果 元の入力した文章をある程度再現できている
まとめ 論文:Language Model Inversion LLM の出力の確率分布には今まで入力された文章の情報が含まれている 確率分布だけから元の入力を再現することができる 今回説明していないが論文で説明されていたこと 確率分布が分からなくても何度か出力が得られれば確率分布を再現できる. つまり,文章の出力しかなくても入力情報を再現できる
社会的な意義 LLM の出力だけから元の入力を再現できるため,セキュリティやプライバシーの 観点でも検討する必要がある
ご清聴ありがとうございました