Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Современный искусственный интеллект в облаке: от кастомных моделей до LLM

Современный искусственный интеллект в облаке: от кастомных моделей до LLM

Dmitri Soshnikov

May 07, 2024
Tweet

More Decks by Dmitri Soshnikov

Other Decks in Programming

Transcript

  1. 2 Эволюция решений в области искусственного интеллекта 1. Обучение моделей

    машинного обучения 2. Предобученные модели 3. Transfer Learning 4. Фундаментальные модели 5. До-обучение 6. Prompt Engineering, RAG Что есть в Yandex Cloud Фундаментальные модели YandexGPT YandexART Платформенные сервисы Yandex SpeechKit Yandex Translate Yandex Vision OCR Среда разработки и обучения ML-моделей Yandex DataSphere
  2. 4 Классический ИИ в облаке: Сайлюгемский национальный парк Разметка Обучение

    Yandex DataSphere Yandex DataLens Yandex Managed Service for YDB Cloud Functions Object Storage Датасет
  3. 6 Области применения искусственного интеллекта Классический ML Компьютерное зрение Обработка

    естественного языка Речь / звук Самостоятельное обучение моделей Предиктивная аналитики Распознавание / обнаружение объектов Классификация Выделение сущностей Text-to-speech Speech-to-text Предобученные модели YOLO BERT OpenAI Whisper Облачные сервисы DataSphere Vision OCR Translate SpeechKit Фундаментальные модели Segment Anything Mistral, Gemma Фундаментальные модели в облаке YandexART YandexGPT
  4. ML-сервисы в Yandex Cloud Готовые модели: доступ по API SpeechKit

    Распознавание и синтез речи. Создание голосовых помощников, автоматизация колл-центров, контроль качества сервиса YandexGPT Генеративная языковая модель для анализа текстовой информации, создания контента и чат-ботов Translate Машинный перевод на 90+ языков, собственный глоссарий Vision OCR Распознавание текста и шаблонов документов, распознавание автомобильных номеров Среда разработки и обучения ML моделей DataSphere Функционал для командной работы и ролевая модель JupyterLab Гибкая конфигурация вычислительных ресурсов c GPU V100 и A100 Data Proc Тесная интеграция со Spark для обработки больших данных в S3 7
  5. 14 Внутреннее и внешнее внимание The animal didn’t cross the

    street because it was too tired The animal didn’t cross the street because it was too wide
  6. 16 LLM умеет то же, что и человек с листом

    бумаги и ручкой И, как человек, некоторые вещи умеет хуже, чем машины
  7. 17 LLM умеет: Хорошо vs Плохо LLM умеет делать хорошо

    • Генерировать и редактировать тексты • Отвечать на вопросы по базе знаний • Чатиться, общаться • Обобщать и интерпретировать данные • Классифицировать и определять тональность текста • Выделять сущности из текста Есть решения, лучше LLM • Ранжирование результатов поиска, рекомендации товаров, услуг и т.д. • Решение задач, подразумевающих строгую логику • Решение задач с низкой толерантностью к ошибке и высокой стоимостью проверки
  8. 18 Пример: извлечение смысла feedback = [ 'Купил iPhone 15.

    Ну что сказать - очень доволен покупкой! Приятный цвет, телефон просто летает, да и камера достаточно хороша!', 'Заказанный телефон Poco X1 пришел в некрасивой упаковке. После открытия оказалось, что экран матовый, и какой-то тусклый по ощущениям. Все фотографии получаются замыленные. В общем, никому не рекомендую покупку!', 'Отличная быстрая доставка! Наслаждаюсь своим новеньким Samsung Galaxy!'] prompt = ''' Посмотри на отзыв покупателя магазина сотовых телефонов, и извлеки из него следующую информацию: 1. Название модели телефона 2. Тональность отзывы: положительная, отрицательная или нейтральная. 3. Основные минусы в отзыве (доставка, камера, внешний вид и др.) 4. Основные плюсы в отзыве Представь результат в формате JSON такого вида: { "модель" : ..., "тональность" : ..., "минусы" : [...], "плюсы" : [...] } Ниже сам текст отзыва: ''' for x in feedback: res = GPT(prompt+x) print(res)
  9. 19 Пример: { "модель": "iPhone 15", "тональность": "положительная", "минусы": [],

    "плюсы": ["приятный цвет", "телефон просто летает", "камера хороша"] }, { "модель": "Poco X1", "тональность": "отрицательная", "минусы": ["некрасивый дизайн упаковки", "матовый экран", "замыленные фотографии"], "плюсы": [] }, { "модель": "Samsung Galaxy", "тональность": "положительная", "минусы": ["камера"], "плюсы": ["быстрая доставка"] }
  10. 21 Первое правило промпт-инжиниринга Никому не рассказывать про промпт-инжиниринг Если

    с первого раза не получился хороший результат – не отчаиваться. Почти всегда нужно несколько попыток, чтобы подобрать идеальный промпт.
  11. 22 Пример: Напиши описание игрушки-самолёта для каталога Игрушечный самолёт «Sky

    Wings» — это отличный выбор для детей, которые любят авиацию и мечтают о полётах. Эта игрушка не только красива и функциональна, но и безопасна для детей любого возраста. Самолёт выполнен из высококачественного пластика, который не содержит вредных веществ и не вызывает аллергии. Он имеет яркий и привлекательный дизайн, который понравится любому ребёнку. «Sky Wings» оснащён инерционным механизмом, который позволяет ему двигаться вперёд после лёгкого толчка. Это делает игру с самолётом ещё более увлекательной и интересной. Игрушечный самолёт «Sky Wings» станет отличным подарком для любого ребёнка, который любит играть с самолётами. Он поможет развить у детей воображение, координацию движений и интерес к авиации. Приобретая игрушечный самолёт «Sky Wings», вы дарите своему ребёнку не просто игрушку, а возможность окунуться в мир авиации и почувствовать себя настоящим пилотом.
  12. 23 Пример: Ты – опытный маркетолог в премиальном магазине игрушек.

    Сгенерируй описание игрушки длинною в два абзаца текста, по приведённым ниже в тройных обратных кавычках данным, ориентированное на пятилетнего ребенка. ``` Название: супер-самолёт Материал: пластмасса Стоимость: 250 р. Возраст: 5+ ``` «Супер-самолёт» — это удивительная игрушка для настоящих пилотов! Он сделан из прочной пластмассы и может летать так высоко, как ты захочешь. С ним ты сможешь отправиться в любое путешествие, а если захочешь, то даже в космос! «Супер-самолёт» станет твоим лучшим другом и помощником в играх. Он научит тебя быть смелым, сильным и всегда добиваться своей цели.
  13. 24 Структура промпта Элемент промпта Пример Начальная установка Ты –

    опытный маркетолог в премиальном магазине игрушек., Задание Сгенерируй описание игрушки для каталога Длина результата длинною в два абзаца текста, Использование ограничителей по приведённым ниже в тройных обратных кавычках данным Целевая аудитория / стиль ориентированное на пятилетнего ребенка. Формат результата Сформируй результат в формате HTML
  14. Приёмы промпт-инжиниринга Sondos Mahmoud Bsharat, Aidar Myrzakhan, Zhiqiang Shen. Principled

    Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4. arXiv:2312.16171 [cs.CL]
  15. 26 Главные бизнес-кейсы LLM Support Подсказки Переформулировка ответа Суммаризация истории

    общений Оценка сервиса Классификация Тренажёр оператора HR Sales Marketing Анализ CV кандидатов Персонализированная коммуникация с кандидатом Мониторинг за перфомансом HR self-service Чат-бот / FAQ на сайте Индивидуальные письма от сейлзов Вычитка / редактура Автоматизация: follow- ups, заполнение CRM Аналитика продаж Персонализированный маркетинг Статьи, новости, посты в блоге Рекламные креативы Аналитика упоминаний Общение в SM
  16. YandexGPT уже используется в сервисах Яндекса Алиса, давай придумаем! Яндекс

    Маркет — «Создать с YaGPT» 300.ya.ru Генерация постов в «Шедевруме»
  17. Результаты 31 Генерация описания товара Задача Генерация качественного описания товара

    с помощью YandexGPT в личном кабинете продавца и использование его для любых карточек 52% сгенерированных GPT-описаний сохранено продавцами +1,1% к заказам Продавцы меньше тратят времени на заполнение карточек и экономят на копирайтинге (рост NPS) Как это работает 1. Продавец заполняет данные о товаре 2. Нажимает кнопку «Создать с YaGPT» 3. Получает продающий текст 4. Публикует товар в магазине
  18. YandexGPT API Модели Инференс Стриминг Для real-time коммуникаций Синхронно Стандарт

    Асинхронно Для отложенных задач обработки данных YandexGPT Lite YandexGPT Pro Эмбеддинги Токенизатор Суммаризация На базе YandexGPT Lite
  19. * Все цены в рублях, включая НДС. Также сервис доступен

    в Казахстане и Сербии. 37 Тарификация моделей YandexGPT API Модель Синхронный вызов Асинхронный вызов YandexGPT Pro 1,20 руб. 0,60 руб. YandexGPT Lite 0,20 руб. 0,10 руб. Embeddings 0,01 руб. Неприменимо Tokenizer Бесплатно Неприменимо
  20. 40 Два подхода Fine-tuning • Дорого и долго • Необходимы

    большие объемы текста с разнообразными запросами • Для внесения изменений нужно повторное обучение • Отличные результаты, если всё сделано правильно Retrieval-Augmented Generation • Быстро и дёшево • Текст, содержащий нужную информацию • Для внесения изменений достаточно поменять текст • Результаты не всегда идеальны
  21. Обучение в DataSphere Не более 10 000 вопросов и ответов

    [ { "request": "текстовый запрос", "response": "ожидаемый ответ" }, { "request": "ещё один текстовый запрос", "response": "новый ожидаемый ответ" }, … ] 41
  22. 46 RAG vs Fine-tuning vs Комбинация Аспект RAG Fine-tuning Комбинация

    Динамические данные Статические данные Внутренние данные Уменьшение галлюцинаций Прозрачность генерации Тонкая настройка под узкую задачу Голос бренда
  23. 47 Почему не использовать Оpen Source языковые модели? Это имеет

    смысл только в случае on-premise. Или когда нужна абсолютная гибкость настройки. YandexGPT API имеет ряд преимуществ: 1. Не нужно иметь свой штат MLOps-/ML-инженеров. 2. Модель постоянно развивается, качество и функциональность растут. 3. Инференс выходит дешевле и быстрее. 4. Простота и скорость итераций дообучения. https://github.com/yandex- datasphere/llm_deploy Но если вдруг хотите…
  24. 48 2 Подбор хорошей инструкции • учитывает контекст • описывает,

    как именно модель должна отвечать по документации Построение поисковой системы по документации 3 4 Автоматизация процесса ответов по базе знаний, встраивание в бизнес- процессы Тестирование и отладка Этапы построения решения 1
  25. 49 2 Подбор хорошей инструкции • учитывает контекст • описывает,

    как именно модель должна отвечать по документации Построение поисковой системы по документации 3 4 Автоматизация процесса ответов по базе знаний, встраивание в бизнес- процессы Тестирование и отладка Этапы построения решения 1 Fine-tuning модели YandexGPT Необходимы эталонные пары запрос-ответ опционально
  26. Дмитрий Сошников к.ф.-м.н., доцент НИУ ВШЭ / МАИ консультант Yandex

    Cloud по машинному обучению https://clck.ru/3AFo6z Спасибо за внимание!