Slide 18
Slide 18 text
AI 18
LoRAにはいくつかのチューニングすべきパラメータが存在
LMSYSコンペにおけるChris DeotteさんによるTipsが参考になる
LoRAのハイパーパラメータ
チューニングのTips by Chris Deotte
● target モジュール
○ できるだけ全てのモジュールを使用
● 学習率、バッチサイズを選択
○ 学習率 : 2e-4 or 2e-5 推奨
○ フルバッチサイズ(gpuごとのバッチサイズxgpu数) : 8 推奨
○ 勾配累積、勾配チェックポイント、複数GPU等も活用
● rとalphaの調整
○ r=16に固定し、alphaを調整(2, 4, 8, 16, 32, 64)
○ 1 epoch(ウォームアップ付き線形スケジュール)で最適なalpha決定
○ alphaを固定しrを調整
https://www.kaggle.com/competitions/lmsys-chatbot-arena/discussion/527596