Upgrade to Pro — share decks privately, control downloads, hide ads and more …

OpenTalks.AI - Игнат Постный, Почему машинное обучение препятствует развитию Legal AI?

opentalks3
February 05, 2021

OpenTalks.AI - Игнат Постный, Почему машинное обучение препятствует развитию Legal AI?

opentalks3

February 05, 2021
Tweet

More Decks by opentalks3

Other Decks in Business

Transcript

  1. OpenTalks.AI 2021 • Постный Игнат Алексеевич: – партнер и исполнительный

    директор TAG Consulting – +10 лет опыта в сфере «legal high-end» – эксперт в области цифровой трансформации бизнеса • email: [email protected] • Telegram: @ipostny
  2. 3 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    • Legal AI — narrow AI для замены юриста • Впечатляющие успехи ML/DL: – синтаксический парсинг предложений (UDPipe, Stanford) – поиск именованных сущностей (BERT, DeepPavlov, spaCy) – генерация текста (GPT-2/3)
  3. 4 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    • Святой Грааль — создать end-to-end решение: – на входе - юридическая практика (законы, судебные решения, договоры…) – на выходе - модель, способная решать сложные творческие задачи (оценка рисков, подготовка юридических документов…)
  4. 5 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    • Воодушевленные успехами ML/DL data-scientist‘ы создали большое количество опасных проблем: – подмена понятий – «brain-dead» - модели – экспоненциальный рост затрат – акцент на решении бесполезных задач
  5. 6 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    • Проблема № 1: ML/ANN ≠ Legal AI – «ничего страшного, что наши модели — это черный ящик, главное — оно РАБОТАЕТ» • «ОК» там, где цена ошибки является невысокой / допустимой: чат-боты, развлечения, скоринг... • Юристам нужен Explainable AI
  6. 7 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    Nigel Richards, 2015: - чемпион в Scrabble - запомнил все слова во французском словаре - не знает значения слов
  7. 8 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    • Проблема № 2: «brain-dead» - модели (GPT-2/3...) • Создаваемые модели не понимают смысл текста
  8. 9 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    • Проблема № 3: взрывной рост расходов – 2,5K - 50K USD (110M параметров) – 10K - 200K USD (340M параметров) – 80K - 1,6M USD (1,5B параметров) – ...и продолжает расти: GPT-3 — 1,8 - 4,6M USD • изначально ML — альтернатива дорогим методам обучения AI https://arxiv.org/pdf/2004.08900.pdf
  9. 10 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    • Проблема № 4: задача << датасет – есть удобные дата-сеты: twitter, обзоры пользователей на фильмы, товары… – надо «найти» (придумать) задачу, для которой подошли бы наши дата-сеты – отличный кандидат — сделаем систему анализа тональности (sentiment analysis)!
  10. 11 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    • Действительно сложные задачи, которые надо решить для создания Legal AI: – обучить Legal AI понимать наши цели – привить Legal AI наши цели – гарантировать, что Legal AI будет разделять наши цели
  11. 12 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

    • Предлагаемая архитектура Legal AI Оптическое распознавание текста (OCR) трансформация скан-копий в машиночитаемый формат Графовые системы знаний оцифрованная логика, знания и опыт экспертов предметной области Семантический анализ обработка текста, идентификация смыслов из содержания документов Результат логические суждения и выводы Первичная информация: скан-копии документов, внешние базы данных... Нейронные сети и машинное обучение генерация выводов и умозаключений на основе логики предметной области