CodeFest 2019. Владислав Лялин (Лаборатория нейронных систем и глубокого обучения МФТИ) — Сonversational AI: как сделать бота, который говорит как человек

Сonversational AI как сделать бота, который говорит как человек Владислав
Лялин Разработчик iPavlov

Кто мы есть Лаборатория нейронных систем и глубокого обучения МФТИ
Проект iPavlov.ai • Исследования в области NLP • Библиотека NLP-решений DeepPavlov.ai 2

Why Conversational AI? 3

Personal assistants • Siri • Google Assistant • Alexa •
Алиса • “Олег” от Tinkoff (?) • что дальше? 4

Personal assistant skills 6 • > 50 000 скилов у
Алексы • x2 за 2018 год • скилы Алексы могут быть платными • или могут предоставлять доступ к вашей платной услуге (заказ пиццы, покупка билетов на самолёт, ...) • люди готовы платить голосом (ну почти)

Personal assistants • Siri • Google Assistant • Alexa •
Алиса • “Олег” от Tinkoff (?) • что дальше? 8

Диалоговые системы раньше 9 Scalability problem

Диалоговые системы сейчас 10

Успехи глубокого обучения 12 • Распознавание изображений: Google, Facebook, etc.
• Машинный перевод: Google, Yandex, etc. • Game playing: Atari games, Го, Starcraft, etc. source: Stanford cs224n

Chit-chat 14

Персонализация 15 NeurIPS 2018 ConvAI2 Challenge: Persona-driven Dialogue Задача: сделать
диалогового агента, обуславливающегося на заданную личность

Персонализация 16 NeurIPS 2018 ConvAI2 Challenge: Persona-driven Dialogue

Больше chit-chat: Xiaoice 18

Xiaoice: Socialbot 19 Shum, Heung-Yeung, XiaodongHe, and Di Li. "From
Eliza to XiaoIce: Challenges and Opportunities with Social Chatbots." arXiv:1801.01957 (2018).

22 Yun-Nung(Vivian) Chen, Towards Open-Domain Conversational Ai, EMNLP SCAI Workshop
(2018).

Успехи глубокого обучения 23 • Распознавание изображений: Google, Facebook, etc.
• Машинный перевод: Google, Yandex, etc. • Game playing: Atari games, Го, Starcraft, etc. source: Stanford cs224n

Успехи глубокого обучения 24 • Распознавание изображений: ImageNet: 15 млн
• Машинный перевод: ~миллионы пар предложений • Game playing: ~10 млн игр source: Stanford cs224n

Размеры датасетов в NLP 25 source: Stanford cs224n

… и это для основных задач на английском 26 source:
Stanford cs224n

Больше датасетов! 27

Transfer Learning 28 SWAG: A Large-Scale Adversarial Dataset for Grounded
Commonsense Inference (EMNLP 2018) allennlp.org/elmo

Предтренировка моделей • ULMfit ~ несколько дней на GPU •
ELMo ~ 6 недель на GPU • BERT ~ 1 год на GPU • GPT-2 ~ 10 лет на GPU 30

Предтренировка моделей • ULMfit ~ несколько дней на GPU •
ELMo ~ 6 недель на GPU • BERT ~ 1 год на GPU • GPT-2 ~ 10 лет на GPU 31 deeppavlov.ai

Цели DeepPavlov Предоставить разработчикам и исследователям: • предобученные модели •
готовые компоненты диалоговых систем (ML/DL/Rule-based) • агенты для типичных сценариев 32

Цели DeepPavlov Предоставить разработчикам и исследователям: • фреймворк для имплементирования
и тестирования диалоговых систем • инструменты для интеграции в мессенджеры, имеющуюся инфраструктуру • benchmarking environment для моделей • простой доступ к датасетам 33

Что есть уже сейчас 35

Конфиги 36

Спелл-чекер 37

Распознавание интентов (DSTC2) 38

Распознавание именованных сущностей 39 “Application of a Hybrid Bi-LSTM-CRF model
to the task of Russian Named Entity recognition” https://arxiv.org/pdf/1709.09686.pdf

Распознавание именованных сущностей 40 docs.deeppavlov.ai/en/master/components/ner.html

Open Domain Question Answering 41

Open Domain Question Answering 42

Open Domain Question Answering 43 www.starwars.com

DeepPavlov 0.2.0 44

@dropout05 Владислав Лялин Разработчик iPavlov Вопросы? facebook.com/guitaricet github.com/guitaricet [email protected]

CodeFest 2019. Владислав Лялин (Лаборатория ней...

CodeFest 2019. Владислав Лялин (Лаборатория нейронных систем и глубокого обучения МФТИ) — Сonversational AI: как сделать бота, который говорит как человек

More Decks by CodeFest

Other Decks in Technology

Featured

Transcript