Slide 1

Slide 1 text

Современный искусственный интеллект в облаке Дмитрий Сошников к.ф.-м.н., доцент НИУ ВШЭ / МАИ консультант Yandex Cloud по машинному обучению

Slide 2

Slide 2 text

2 Эволюция решений в области искусственного интеллекта 1. Обучение моделей машинного обучения 2. Предобученные модели 3. Transfer Learning 4. Фундаментальные модели 5. До-обучение 6. Prompt Engineering, RAG Что есть в Yandex Cloud Фундаментальные модели YandexGPT YandexART Платформенные сервисы Yandex SpeechKit Yandex Translate Yandex Vision OCR Среда разработки и обучения ML-моделей Yandex DataSphere

Slide 3

Slide 3 text

3 Классический ИИ в облаке: Сайлюгемский национальный парк

Slide 4

Slide 4 text

4 Классический ИИ в облаке: Сайлюгемский национальный парк Разметка Обучение Yandex DataSphere Yandex DataLens Yandex Managed Service for YDB Cloud Functions Object Storage Датасет

Slide 5

Slide 5 text

5 Классический ИИ в облаке: Сайлюгемский национальный парк

Slide 6

Slide 6 text

6 Области применения искусственного интеллекта Классический ML Компьютерное зрение Обработка естественного языка Речь / звук Самостоятельное обучение моделей Предиктивная аналитики Распознавание / обнаружение объектов Классификация Выделение сущностей Text-to-speech Speech-to-text Предобученные модели YOLO BERT OpenAI Whisper Облачные сервисы DataSphere Vision OCR Translate SpeechKit Фундаментальные модели Segment Anything Mistral, Gemma Фундаментальные модели в облаке YandexART YandexGPT

Slide 7

Slide 7 text

ML-сервисы в Yandex Cloud Готовые модели: доступ по API SpeechKit Распознавание и синтез речи. Создание голосовых помощников, автоматизация колл-центров, контроль качества сервиса YandexGPT Генеративная языковая модель для анализа текстовой информации, создания контента и чат-ботов Translate Машинный перевод на 90+ языков, собственный глоссарий Vision OCR Распознавание текста и шаблонов документов, распознавание автомобильных номеров Среда разработки и обучения ML моделей DataSphere Функционал для командной работы и ролевая модель JupyterLab Гибкая конфигурация вычислительных ресурсов c GPU V100 и A100 Data Proc Тесная интеграция со Spark для обработки больших данных в S3 7

Slide 8

Slide 8 text

Пример: вопрос-ответный бот Telegram Логика бота (VM/Kubernetes) YandexGPT Managed Service for OpenSearch SpeechKit

Slide 9

Slide 9 text

Большие языковые модели

Slide 10

Slide 10 text

Как работают нейросети X1 X2 XN … Y2 Y1 Axons Dendrites

Slide 11

Slide 11 text

11 Малые языковые модели

Slide 12

Slide 12 text

12 Машинный перевод и его проблемы

Slide 13

Slide 13 text

13 Внимание

Slide 14

Slide 14 text

14 Внутреннее и внешнее внимание The animal didn’t cross the street because it was too tired The animal didn’t cross the street because it was too wide

Slide 15

Slide 15 text

15 Как устроены LLM

Slide 16

Slide 16 text

16 LLM умеет то же, что и человек с листом бумаги и ручкой И, как человек, некоторые вещи умеет хуже, чем машины

Slide 17

Slide 17 text

17 LLM умеет: Хорошо vs Плохо LLM умеет делать хорошо • Генерировать и редактировать тексты • Отвечать на вопросы по базе знаний • Чатиться, общаться • Обобщать и интерпретировать данные • Классифицировать и определять тональность текста • Выделять сущности из текста Есть решения, лучше LLM • Ранжирование результатов поиска, рекомендации товаров, услуг и т.д. • Решение задач, подразумевающих строгую логику • Решение задач с низкой толерантностью к ошибке и высокой стоимостью проверки

Slide 18

Slide 18 text

18 Пример: извлечение смысла feedback = [ 'Купил iPhone 15. Ну что сказать - очень доволен покупкой! Приятный цвет, телефон просто летает, да и камера достаточно хороша!', 'Заказанный телефон Poco X1 пришел в некрасивой упаковке. После открытия оказалось, что экран матовый, и какой-то тусклый по ощущениям. Все фотографии получаются замыленные. В общем, никому не рекомендую покупку!', 'Отличная быстрая доставка! Наслаждаюсь своим новеньким Samsung Galaxy!'] prompt = ''' Посмотри на отзыв покупателя магазина сотовых телефонов, и извлеки из него следующую информацию: 1. Название модели телефона 2. Тональность отзывы: положительная, отрицательная или нейтральная. 3. Основные минусы в отзыве (доставка, камера, внешний вид и др.) 4. Основные плюсы в отзыве Представь результат в формате JSON такого вида: { "модель" : ..., "тональность" : ..., "минусы" : [...], "плюсы" : [...] } Ниже сам текст отзыва: ''' for x in feedback: res = GPT(prompt+x) print(res)

Slide 19

Slide 19 text

19 Пример: { "модель": "iPhone 15", "тональность": "положительная", "минусы": [], "плюсы": ["приятный цвет", "телефон просто летает", "камера хороша"] }, { "модель": "Poco X1", "тональность": "отрицательная", "минусы": ["некрасивый дизайн упаковки", "матовый экран", "замыленные фотографии"], "плюсы": [] }, { "модель": "Samsung Galaxy", "тональность": "положительная", "минусы": ["камера"], "плюсы": ["быстрая доставка"] }

Slide 20

Slide 20 text

20 Промпт-инжиниринг Для разработчиков https://github.com/ yandex-datasphere/ PromptEngineering4Devs Для ваших родителей →

Slide 21

Slide 21 text

21 Первое правило промпт-инжиниринга Никому не рассказывать про промпт-инжиниринг Если с первого раза не получился хороший результат – не отчаиваться. Почти всегда нужно несколько попыток, чтобы подобрать идеальный промпт.

Slide 22

Slide 22 text

22 Пример: Напиши описание игрушки-самолёта для каталога Игрушечный самолёт «Sky Wings» — это отличный выбор для детей, которые любят авиацию и мечтают о полётах. Эта игрушка не только красива и функциональна, но и безопасна для детей любого возраста. Самолёт выполнен из высококачественного пластика, который не содержит вредных веществ и не вызывает аллергии. Он имеет яркий и привлекательный дизайн, который понравится любому ребёнку. «Sky Wings» оснащён инерционным механизмом, который позволяет ему двигаться вперёд после лёгкого толчка. Это делает игру с самолётом ещё более увлекательной и интересной. Игрушечный самолёт «Sky Wings» станет отличным подарком для любого ребёнка, который любит играть с самолётами. Он поможет развить у детей воображение, координацию движений и интерес к авиации. Приобретая игрушечный самолёт «Sky Wings», вы дарите своему ребёнку не просто игрушку, а возможность окунуться в мир авиации и почувствовать себя настоящим пилотом.

Slide 23

Slide 23 text

23 Пример: Ты – опытный маркетолог в премиальном магазине игрушек. Сгенерируй описание игрушки длинною в два абзаца текста, по приведённым ниже в тройных обратных кавычках данным, ориентированное на пятилетнего ребенка. ``` Название: супер-самолёт Материал: пластмасса Стоимость: 250 р. Возраст: 5+ ``` «Супер-самолёт» — это удивительная игрушка для настоящих пилотов! Он сделан из прочной пластмассы и может летать так высоко, как ты захочешь. С ним ты сможешь отправиться в любое путешествие, а если захочешь, то даже в космос! «Супер-самолёт» станет твоим лучшим другом и помощником в играх. Он научит тебя быть смелым, сильным и всегда добиваться своей цели.

Slide 24

Slide 24 text

24 Структура промпта Элемент промпта Пример Начальная установка Ты – опытный маркетолог в премиальном магазине игрушек., Задание Сгенерируй описание игрушки для каталога Длина результата длинною в два абзаца текста, Использование ограничителей по приведённым ниже в тройных обратных кавычках данным Целевая аудитория / стиль ориентированное на пятилетнего ребенка. Формат результата Сформируй результат в формате HTML

Slide 25

Slide 25 text

Приёмы промпт-инжиниринга Sondos Mahmoud Bsharat, Aidar Myrzakhan, Zhiqiang Shen. Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4. arXiv:2312.16171 [cs.CL]

Slide 26

Slide 26 text

26 Главные бизнес-кейсы LLM Support Подсказки Переформулировка ответа Суммаризация истории общений Оценка сервиса Классификация Тренажёр оператора HR Sales Marketing Анализ CV кандидатов Персонализированная коммуникация с кандидатом Мониторинг за перфомансом HR self-service Чат-бот / FAQ на сайте Индивидуальные письма от сейлзов Вычитка / редактура Автоматизация: follow- ups, заполнение CRM Аналитика продаж Персонализированный маркетинг Статьи, новости, посты в блоге Рекламные креативы Аналитика упоминаний Общение в SM

Slide 27

Slide 27 text

27 А также Юристы Разработка программного обеспечения Финансы

Slide 28

Slide 28 text

LLM в Яндексе

Slide 29

Slide 29 text

YandexGPT 29 интеграций в продуктах Яндекса

Slide 30

Slide 30 text

YandexGPT уже используется в сервисах Яндекса Алиса, давай придумаем! Яндекс Маркет — «Создать с YaGPT» 300.ya.ru Генерация постов в «Шедевруме»

Slide 31

Slide 31 text

Результаты 31 Генерация описания товара Задача Генерация качественного описания товара с помощью YandexGPT в личном кабинете продавца и использование его для любых карточек 52% сгенерированных GPT-описаний сохранено продавцами +1,1% к заказам Продавцы меньше тратят времени на заполнение карточек и экономят на копирайтинге (рост NPS) Как это работает 1. Продавец заполняет данные о товаре 2. Нажимает кнопку «Создать с YaGPT» 3. Получает продающий текст 4. Публикует товар в магазине

Slide 32

Slide 32 text

32 Суммаризация отзывов на Маркете ¢

Slide 33

Slide 33 text

33 Суммаризация отзывов на Маркете

Slide 34

Slide 34 text

34 Суммаризация видео 475 лет сэкономлено за месяц

Slide 35

Slide 35 text

Возможности YandexGPT API

Slide 36

Slide 36 text

YandexGPT API Модели Инференс Стриминг Для real-time коммуникаций Синхронно Стандарт Асинхронно Для отложенных задач обработки данных YandexGPT Lite YandexGPT Pro Эмбеддинги Токенизатор Суммаризация На базе YandexGPT Lite

Slide 37

Slide 37 text

* Все цены в рублях, включая НДС. Также сервис доступен в Казахстане и Сербии. 37 Тарификация моделей YandexGPT API Модель Синхронный вызов Асинхронный вызов YandexGPT Pro 1,20 руб. 0,60 руб. YandexGPT Lite 0,20 руб. 0,10 руб. Embeddings 0,01 руб. Неприменимо Tokenizer Бесплатно Неприменимо

Slide 38

Slide 38 text

38 Консоль: instruct-режим

Slide 39

Slide 39 text

Специализация / до-обучение моделей

Slide 40

Slide 40 text

40 Два подхода Fine-tuning • Дорого и долго • Необходимы большие объемы текста с разнообразными запросами • Для внесения изменений нужно повторное обучение • Отличные результаты, если всё сделано правильно Retrieval-Augmented Generation • Быстро и дёшево • Текст, содержащий нужную информацию • Для внесения изменений достаточно поменять текст • Результаты не всегда идеальны

Slide 41

Slide 41 text

Обучение в DataSphere Не более 10 000 вопросов и ответов [ { "request": "текстовый запрос", "response": "ожидаемый ответ" }, { "request": "ещё один текстовый запрос", "response": "новый ожидаемый ответ" }, … ] 41

Slide 42

Slide 42 text

42 Retrieval-Augmented Generation

Slide 43

Slide 43 text

43 Мастер-класс по RAG https://github.com/yandex- datasphere/yatalks-potter-bot

Slide 44

Slide 44 text

44 Использование YandexGPT: LangChain https://github.com/yandex-datasphere/yandex-chain

Slide 45

Slide 45 text

45 Использование YandexGPT для RAG

Slide 46

Slide 46 text

46 RAG vs Fine-tuning vs Комбинация Аспект RAG Fine-tuning Комбинация Динамические данные Статические данные Внутренние данные Уменьшение галлюцинаций Прозрачность генерации Тонкая настройка под узкую задачу Голос бренда

Slide 47

Slide 47 text

47 Почему не использовать Оpen Source языковые модели? Это имеет смысл только в случае on-premise. Или когда нужна абсолютная гибкость настройки. YandexGPT API имеет ряд преимуществ: 1. Не нужно иметь свой штат MLOps-/ML-инженеров. 2. Модель постоянно развивается, качество и функциональность растут. 3. Инференс выходит дешевле и быстрее. 4. Простота и скорость итераций дообучения. https://github.com/yandex- datasphere/llm_deploy Но если вдруг хотите…

Slide 48

Slide 48 text

48 2 Подбор хорошей инструкции • учитывает контекст • описывает, как именно модель должна отвечать по документации Построение поисковой системы по документации 3 4 Автоматизация процесса ответов по базе знаний, встраивание в бизнес- процессы Тестирование и отладка Этапы построения решения 1

Slide 49

Slide 49 text

49 2 Подбор хорошей инструкции • учитывает контекст • описывает, как именно модель должна отвечать по документации Построение поисковой системы по документации 3 4 Автоматизация процесса ответов по базе знаний, встраивание в бизнес- процессы Тестирование и отладка Этапы построения решения 1 Fine-tuning модели YandexGPT Необходимы эталонные пары запрос-ответ опционально

Slide 50

Slide 50 text

50 Реализация в Yandex Cloud YandexGPT

Slide 51

Slide 51 text

Дмитрий Сошников к.ф.-м.н., доцент НИУ ВШЭ / МАИ консультант Yandex Cloud по машинному обучению https://clck.ru/3AFo6z Спасибо за внимание!