Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CodeFest 2019. Владислав Лялин (Лаборатория нейронных систем и глубокого обучения МФТИ) — Сonversational AI: как сделать бота, который говорит как человек

CodeFest
April 05, 2019

CodeFest 2019. Владислав Лялин (Лаборатория нейронных систем и глубокого обучения МФТИ) — Сonversational AI: как сделать бота, который говорит как человек

Человеческий язык — самый естественный интерфейс. Для него не нужны мануалы, и люди всех возрастов могут его использовать. На данный момент не так много устройств, которые нас окружают, умеют говорить на человеческом языке, но это постепенно меняется. Устройства типа Яндекс.Станции, Amazon Alexa становятся всё более популярными и постепенно входят в нашу жизнь.

Как они устроены сейчас, чем хороши и плохи те или иные подходы, что может измениться в ближайшее время и при чём тут deep learning? Пару слов о самых важных результатах в обработке естественного языка за предыдущий год, основных проблемах разговорного искусственного интеллекта и тех чат-ботах, которые и правда работают. И чуть больше, чем пара слов — о библиотеке DeepPavlov для разработки таких чат-ботов.

CodeFest

April 05, 2019
Tweet

More Decks by CodeFest

Other Decks in Technology

Transcript

  1. Кто мы есть Лаборатория нейронных систем и глубокого обучения МФТИ

    Проект iPavlov.ai • Исследования в области NLP • Библиотека NLP-решений DeepPavlov.ai 2
  2. Personal assistants • Siri • Google Assistant • Alexa •

    Алиса • “Олег” от Tinkoff (?) • что дальше? 4
  3. 5

  4. Personal assistant skills 6 • > 50 000 скилов у

    Алексы • x2 за 2018 год • скилы Алексы могут быть платными • или могут предоставлять доступ к вашей платной услуге (заказ пиццы, покупка билетов на самолёт, ...) • люди готовы платить голосом (ну почти)
  5. 7

  6. Personal assistants • Siri • Google Assistant • Alexa •

    Алиса • “Олег” от Tinkoff (?) • что дальше? 8
  7. 11

  8. Успехи глубокого обучения 12 • Распознавание изображений: Google, Facebook, etc.

    • Машинный перевод: Google, Yandex, etc. • Game playing: Atari games, Го, Starcraft, etc. source: Stanford cs224n
  9. 13

  10. Персонализация 15 NeurIPS 2018 ConvAI2 Challenge: Persona-driven Dialogue Задача: сделать

    диалогового агента, обуславливающегося на заданную личность
  11. Xiaoice: Socialbot 19 Shum, Heung-Yeung, XiaodongHe, and Di Li. "From

    Eliza to XiaoIce: Challenges and Opportunities with Social Chatbots." arXiv:1801.01957 (2018).
  12. Xiaoice: Socialbot 20 Shum, Heung-Yeung, XiaodongHe, and Di Li. "From

    Eliza to XiaoIce: Challenges and Opportunities with Social Chatbots." arXiv:1801.01957 (2018).
  13. Xiaoice: Socialbot 21 Shum, Heung-Yeung, XiaodongHe, and Di Li. "From

    Eliza to XiaoIce: Challenges and Opportunities with Social Chatbots." arXiv:1801.01957 (2018).
  14. Успехи глубокого обучения 23 • Распознавание изображений: Google, Facebook, etc.

    • Машинный перевод: Google, Yandex, etc. • Game playing: Atari games, Го, Starcraft, etc. source: Stanford cs224n
  15. Успехи глубокого обучения 24 • Распознавание изображений: ImageNet: 15 млн

    • Машинный перевод: ~миллионы пар предложений • Game playing: ~10 млн игр source: Stanford cs224n
  16. Transfer Learning 28 SWAG: A Large-Scale Adversarial Dataset for Grounded

    Commonsense Inference (EMNLP 2018) allennlp.org/elmo
  17. 29

  18. Предтренировка моделей • ULMfit ~ несколько дней на GPU •

    ELMo ~ 6 недель на GPU • BERT ~ 1 год на GPU • GPT-2 ~ 10 лет на GPU 30
  19. Предтренировка моделей • ULMfit ~ несколько дней на GPU •

    ELMo ~ 6 недель на GPU • BERT ~ 1 год на GPU • GPT-2 ~ 10 лет на GPU 31 deeppavlov.ai
  20. Цели DeepPavlov Предоставить разработчикам и исследователям: • предобученные модели •

    готовые компоненты диалоговых систем (ML/DL/Rule-based) • агенты для типичных сценариев 32
  21. Цели DeepPavlov Предоставить разработчикам и исследователям: • фреймворк для имплементирования

    и тестирования диалоговых систем • инструменты для интеграции в мессенджеры, имеющуюся инфраструктуру • benchmarking environment для моделей • простой доступ к датасетам 33
  22. 34

  23. Распознавание именованных сущностей 39 “Application of a Hybrid Bi-LSTM-CRF model

    to the task of Russian Named Entity recognition” https://arxiv.org/pdf/1709.09686.pdf