Fine Tuning

Fine Tuning Nedir? Fine tuning (fine tuning), önceden eğitilmiş bir
modelin belirli bir görev için yeniden optimize edilmesi sürecidir. Genellikle büyük modellerin (örneğin, ResNet, BERT, GPT) öğrendiği temel özelliklerin korunarak son katmanlarının yeni bir göreve uyarlanmasını içerir.

Neden Fine Tuning İşlemine İhtiyaç Duyarız? Önceden öğrenilen karmaşık özelliklerin
(örneğin, kenar ve doku tespiti) korunmasıyla modelin belirli bir görevi daha iyi öğrenmesi sağlanır. Zaman ve Kaynak Tasarrufu: Büyük bir modeli sıfırdan eğitmek hem yüksek işlem gücü hem de uzun zaman gerektirir. Önceden eğitilmiş modeli temel alarak, eğitim süreci önemli ölçüde kısalır. Sınırlı Veriyle Yüksek Performans: Yeni bir görev için az veriye sahip olduğunuzda, fine tuning mevcut modelin genel özelliklerini kullanarak verimli bir şekilde öğrenmeyi sağlar. Göreve Özel Optimizasyon:

Fine Tuning Ne Gibi Faydalar Sağlar? Yüksek Performans: Büyük modellerin
geniş veri kümelerinde öğrendiği özellikler yeni görevlere taşınarak daha hızlı ve yüksek doğruluk elde edilir. Esneklik: Modelin son katmanları (veya seçilen ara katmanlar) kolayca değiştirilerek farklı problemlere uyarlanabilir. Düşük Maliyet: Sıfırdan eğitime göre daha az donanım ve zaman gerektirir.

Dezavantajları Aşırı Uyum (Overfitting) Riski: Küçük veri kümelerinde, tüm parametrelerin
güncellenmesi aşırı uyuma yol açabilir. Hesaplama Maliyeti: Çok büyük modeller (örneğin, GPT-3) bile fine tuning için yüksek bellek ve GPU kullanımı gerektirebilir.

Fine Tuning Teknikleri Full Fine Tuning Parameter Efficient Fine Tuning
Prompt Tuning Adapters QLoRA LoRA

Önceden eğitilmiş (pre-trained) bir modeldeki tüm parametrelerin, yeni bir görev
için güncellenmesi işlemidir. Bu, modelin tüm katmanlarının yeni veri üzerinde eğitilmesi anlamına gelir. Avantajları: En yüksek potansiyel doğruluğu sağlayabilir, çünkü model tamamen yeni göreve adapte olur. Eğer yeterli miktarda veri varsa, en iyi sonuçları verir. Dezavantajları: Hesaplama açısından maliyetlidir, özellikle büyük modellerde. Çok fazla GPU belleği ve zaman gerektirebilir. Overfitting riski yüksektir, özellikle küçük veri setlerinde. Büyük modellerde, ince fine-tuning)yapmak pratik olmayabilir. Full Fine Tuning

Parameter Efficient Fine Tuning PEFT yöntemleri, fine tuning sırasında sadece
küçük bir parametre alt kümesini eğiterek, bellek ve işlem maliyetlerini düşürmeyi hedefler. Bu yöntemler, büyük dil modellerini (LLM'ler) daha erişilebilir hale getirmek için tasarlanmıştır.

Adapters Adapters, önceden eğitilmiş bir modelin katmanlarına eklenen küçük, eğitilebilir
modüllerdir. Modelin orijinal parametreleri dondurulur ve sadece adapter modüllerinin parametreleri güncellenir. Avantajları: fine tuning maliyetini düşürür. Farklı görevler için farklı adapter'ler kullanılabilir, bu da modelin farklı görevlere adapte olmasını kolaylaştırır. Dezavantajları: Eklenen adapter modülleri, modelin karmaşıklığını artırabilir.

Adapters

LoRA(Low-Rank Adaptation) LoRA, önceden eğitilmiş modelin ağırlık matrislerine düşük ranklı
matrisler ekleyerek fine tuning yapmayı sağlayan bir PEFT yöntemidir. Modelin orijinal ağırlıkları dondurulur ve sadece eklenen düşük ranklı matrisler eğitilir.

LoRA(Low-Rank Adaptation) Avantajları: Fine tuning maliyetini önemli ölçüde azaltır. Hızlı
fine tuning süreleri sağlar. Dezavantajları: Full fine tuning kadar yüksek doğruluk sağlamayabilir. Düşük ranklı matrislerin boyutu, performansı etkileyebilir.

QLoRA (Quantized Low-Rank Adaptation) Büyük dil modellerini kuantizasyon (niceleme) kullanarak
fine tuning yapmayı sağlayan bir PEFT yöntemidir. Bu, bellek gereksinimlerini önemli ölçüde azaltır ve daha küçük GPU'larda bile büyük modellerin fine tune edilmesini mümkün kılar. QLoRA, düşük ranklı adaptasyon (LoRA) tekniğini kullanır. Avantajları: Çok düşük bellek kullanımı sağlar. Büyük modellerin daha erişilebilir donanımlarda fine tuning yapmayı mümkün kılar. Dezavantajları: Kuantizasyon nedeniyle bir miktar doğruluk kaybı olabilir.

Kuantizasyon, yüksek hassasiyetli değerlerin daha düşük hassasiyetli bir değere eşlenmesini
içeren bir sıkıştırma tekniğidir. LLM'ler genellikle float32 veya float16 kayan nokta sayıları ile eğitilir. Kuantizasyon, FP32 ağırlık değerlerinin aralığını FP16 veya hatta INT4 (Integer 4 bit) veri türleri gibi daha düşük hassasiyetli değerlere temsil etmenin bir yolunu bulmaya çalışır. Kuantizasyon - Quantization

FP32 – Her bir parameter 32 bitle temsil edilir. FP16
- Her bir parameter 16 bitle temsil edilir. 8 bit 1 bayt 7B parametreli bir model için (7=N) FP16 ile: -Parametreler 2*7 = 14GB -Gradyanlar 2*N = 14GB -Optimizers 4*N = 28GB -Data(Batch size, sequence length, embedding size) GPU Belleği Hesaplaması

https://medium.com/@whyamit404/fine-tuning-vs-peft-parameter-efficient-fine-tuning- a-practical-guide-3844e5688000 https://ai.plainenglish.io/understanding-low-rank-adaptation-lora-for-efficient-fine- tuning-of-large-language-models-082d223bb6db https://medium.com/@techresearchspace/what-is-quantization-in-llm-01ba61968a51 https://towardsdatascience.com/the-ultimate-handbook-for-llm-quantization- 88bb7cb0d9d7/ https://www.maartengrootendorst.com/blog/quantization/#how-to-represent-numerical- values https://cbarkinozer.medium.com/model-nicemlemeyi-quantization-%C4%B1-
derinlemesine-%C3%B6%C4%9Freniyoruz-4afb7b1d773c Kaynaklar

Code Session

Fine Tuning

Fine Tuning

Selin ÇILDAM

Featured

Transcript

Fine Tuning

Fine Tuning Nedir? Fine tuning (fine tuning), önceden eğitilmiş bir

Neden Fine Tuning İşlemine İhtiyaç Duyarız? Önceden öğrenilen karmaşık özelliklerin

Fine Tuning Ne Gibi Faydalar Sağlar? Yüksek Performans: Büyük modellerin

Dezavantajları Aşırı Uyum (Overfitting) Riski: Küçük veri kümelerinde, tüm parametrelerin

Fine Tuning Teknikleri Full Fine Tuning Parameter Efficient Fine Tuning

Önceden eğitilmiş (pre-trained) bir modeldeki tüm parametrelerin, yeni bir görev

Parameter Efficient Fine Tuning PEFT yöntemleri, fine tuning sırasında sadece

Adapters Adapters, önceden eğitilmiş bir modelin katmanlarına eklenen küçük, eğitilebilir

Adapters

LoRA(Low-Rank Adaptation) LoRA, önceden eğitilmiş modelin ağırlık matrislerine düşük ranklı

LoRA(Low-Rank Adaptation) Avantajları: Fine tuning maliyetini önemli ölçüde azaltır. Hızlı

QLoRA (Quantized Low-Rank Adaptation) Büyük dil modellerini kuantizasyon (niceleme) kullanarak

Kuantizasyon, yüksek hassasiyetli değerlerin daha düşük hassasiyetli bir değere eşlenmesini

FP32 – Her bir parameter 32 bitle temsil edilir. FP16

Code Session