Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)
Search
Rei Sato
January 21, 2025
Research
0
16
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)
https://lycorptech-jp.connpass.com/event/339481/
Rei Sato
January 21, 2025
Tweet
Share
More Decks by Rei Sato
See All by Rei Sato
NeurIPS2023-paper-reading-PGDiff
reisato12345
0
500
NeurIPS2022_face_image_synthesis_series
reisato12345
2
910
Other Decks in Research
See All in Research
The many faces of AI and the role of mathematics
gpeyre
1
1.5k
尺度開発における質的研究アプローチ(自主企画シンポジウム7:認知行動療法における尺度開発のこれから)
litalicolab
0
390
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
8
1.2k
20241115都市交通決起集会 趣旨説明・熊本事例紹介
trafficbrain
0
870
第79回 産総研人工知能セミナー 発表資料
agiats
3
190
20240918 交通くまもとーく 未来の鉄道網編(太田恒平)
trafficbrain
0
440
LLM 시대의 Compliance: Safety & Security
huffon
0
490
情報処理学会関西支部2024年度定期講演会「自然言語処理と大規模言語モデルの基礎」
ksudoh
10
2.4k
Large Vision Language Model (LVLM) に関する最新知見まとめ (Part 1)
onely7
23
5.4k
博士学位論文予備審査 / Scaling Telemetry Workloads in Cloud Applications: Techniques for Instrumentation, Storage, and Mining
yuukit
1
1.6k
湯村研究室の紹介2024 / yumulab2024
yumulab
0
370
Weekly AI Agents News! 9月号 プロダクト/ニュースのアーカイブ
masatoto
2
180
Featured
See All Featured
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Making Projects Easy
brettharned
116
6k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.6k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
230
52k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
3
240
Building Adaptive Systems
keathley
38
2.4k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
28
2.2k
Rails Girls Zürich Keynote
gr2m
94
13k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
113
50k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
Transcript
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G) 佐藤怜 LINEヤフー株式会社 NeurIPS
2024 論文読み会 2025/01/23
自己紹介: 佐藤怜 / Rei Sato • 筑波大学修士22卒 • LINEヤフーで機械学習エンジニア ◦
近況: LLMのR&D • NeurIPS 2022, 2023 論文読み会に続き3回目 • NeurIPS 2024に現地参加 (プロフィールHP) 2
NeurIPS 2024概要 • 機械学習のトップ国際会議 • カナダのバンクーバーで開催 • ↓ 2024年の頻出キーワード 1
Large Language Models 2 Reinforcement Learning 3 Diffusion Models 4 Graph Neural Networks 5 Transformer https://papercopilot.com/paper-list/neurips-paper-list/neurips- 2024-paper-list/ 3
会議のスケール • 投稿数: 9千(2021), 1万(2022), 1.2万(2023), 1.6万(2024) • 採択率: 約25%を維持
• Registrationは抽選が発生(著者は抽選なし) 4
• 各社のあれこれを聞いてグッズをゲットする • 博士号 or 米国での就労資格があると就活に有利 企業ブース 5
Q. なぜ現地参加 A. 論文採択 Stepwise Alignment for Constrained Language Model
Policy Optimization https://openreview.net/forum?id=VrVx83BkQX 6
発表した論文: SACPOについて(1) ChatGPTのような対話型LLMの応答の質を評価するとき 有用性(どれだけ有益な情報を提供するか)だけでなく 安全性(どれだけ有害な情報の提供をしないか)も重要 LLMレスポンス 2: 法律・安全・倫理の観点 から特別な許可なしに 試みるべきではありま
せん 有用性: レスポンス1 > レスポンス2 安全性: レスポンス1 < レスポンス2 LLMレスポンス 1: 材料Aと材料Bを器具C で加工します ユーザープロンプト : 爆弾の作り方を教えて 7
発表した論文: SACPOについて(2) 1行目前半: 有用性rの期待値を最大化するようにLLM πを学習 1行目後半: LLM πが学習前のLLM π_refから乖離しないように正則化 2行目:
安全性gの期待値がbを超えるようにLLM πを制約 解きたい問題 8
解きたければ解けばよかろう → 煩雑で不安定 [Safe RLHF] 発表した論文: SACPOについて(3) Safe RLHFの手順: (1)
有用性と安全性を評価する関数を教師あり学習 (2) これを最大化するようにLLMを強化学習 → 従来のRLHFの問題を引き継ぐ Safe RLHF: Safe Reinforcement Learning from Human Feedback https://arxiv.org/abs/2310.12773 9
SACPOの手順: (1) 有用性を最大化するようにLLMをDPO(教師あり)で学習 (2) (1)のLLMに対して更に安全性 〃 → RLHFがDPOで置換されたことで学習が安定 発表した論文: SACPOについて(4)
もっと簡便で安定した最適化はないか ? → SACPO 10
発表した論文: SACPOについて(5) Q. 実用的には優れていてもあくまで元の最適化問題への近似手法? A. いいえ,元の最適化問題に理論的に一致します 11
ファーストオーサーであるLINEヤフーの和地が解説 NLPコロキウム第71回 https://www.youtube.com/watch?v=-SKeuQibvoQ もっと詳しく 12
• 3人の発表者が個別に2.5/3時間ほど聴講者の対応をするくらい好評 • ホットな研究を積極的に宣伝するなら2~4人で臨む必要あり (コストはさておき) 発表の様子 13
論文「Ctrl-G」について(1) 2行目: 安全性gの期待値がbを超えるようにLLM πを制約 もしgがLLMの応答yがある正規表現にマッチするかどうか を判定するものだったら ...? リマインド : SACPOの最適化問題
14
Ctrl-G: 正規表現にマッチするように LLMの出力を誘導する (K) キーワードの集合を与えてそれを含むように回答する (L) 指定された範囲の長さで回答する 論文「Ctrl-G」について(2) Adaptable Logical
Control for Large Language Models https://arxiv.org/abs/2406.13892 15
LLMの追加学習はせず,推論時にトークン生成確率を操作 論文「Ctrl-G」について(3) 16 • 計算したい確率 : 生成済みトークン列x<tと制約αに条件付けられた LLMによるトークンx_tの生成確率 • 通常のLLMで計算できる確率
: 生成済みトークン列x<tに条件付けら れたLLMによるトークンx_tの生成確率 • 非自明な確率 : x<tとx_tから生成を続けて最終的に制約αを充足する 確率
論文「Ctrl-G」について(4) 17 Adaptable Logical Control for Large Language Models https://arxiv.org/abs/2406.13892
LLMをHMMで近似 & 正規表現を DFAで表現 → Forwardアルゴリズムを活用して右辺を計算する