Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Исследования в Alignment GigaChat

Исследования в Alignment GigaChat

Конференция GIGA R&D DAY
Презентации на Google Drive: https://drive.google.com/drive/folders/1t1Y5sH4mGFAIzdcrrfXz8m65QEmghA7U
Выступления: https://www.youtube.com/playlist?list=PLJU_M19giWaHVbfs2ltF1kBxUrjAblCD1

Alexander Gavrilov

April 16, 2024
Tweet

More Decks by Alexander Gavrilov

Other Decks in Technology

Transcript

  1. Alignment своими словами — AI-система умеет на одинаково хорошем уровне

    решать 
 различные задачи — Сохраняется стиль и полнота ответов — При добавлении нового кейса система не ломается
  2. Мультикомандная разработка — Единый репозиторий для процессинга данных и аугментаций

    — Единый репозиторий для обучения модели — Единый репозиторий для автоматического замера качества Централизация
  3. Сложности добавления новых задач — «Забывание» знаний из pretrain-стадии после

    SFT обучения — Утрата способности модели к обобщению на задачах из непокрытых доменов Catastrophic forgetting
  4. Чем еще мы занимаемся GigaRAG Рассортируй чемпионов по количеству титулов

    подряд: Шумахер; Сена; Вильнёв Михаэль Шумахер — 5 титулов подряд. Айртон Сенна — 2 титула подряд. Жак Вильнёв — 1 титул подряд. WIKI WEB
  5. Чем еще мы занимаемся Генерация данных Генератор запросов к разным

    БД Валидатор запросов Генерация промптов Редакторы Генерация синтетики
  6. Как понимаем, что получили прирост качества Автометрики MMLU/en 5-shot MMLU/ru

    Продуктовые задачи Ответы по документам GigaChat Pro [25.01.2024] 68.8 60.7 76.5 77.1 GigaChat Lite [25.01.2024] 60.5 52.8 70 72.1
  7. Платформа для исследований в Alignment — Prod и Research на

    одной кодовой базе — Чистые данные в SFT — Общее хранилище моделей и данных — Репозиторий для замера автометрик