Upgrade to Pro — share decks privately, control downloads, hide ads and more …

OpenTalks.AI - Игнат Постный, Почему машинное обучение препятствует развитию Legal AI?

opentalks3
February 05, 2021

OpenTalks.AI - Игнат Постный, Почему машинное обучение препятствует развитию Legal AI?

opentalks3

February 05, 2021
Tweet

More Decks by opentalks3

Other Decks in Business

Transcript

  1. OpenTalks.AI 2021
    Почему машинное обучение
    препятствует развитию Legal AI?

    View Slide

  2. OpenTalks.AI 2021

    Постный Игнат Алексеевич:
    – партнер и исполнительный директор
    TAG Consulting
    – +10 лет опыта в сфере «legal high-end»
    – эксперт в области цифровой
    трансформации бизнеса

    email: [email protected]

    Telegram: @ipostny

    View Slide

  3. 3
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?

    Legal AI — narrow AI для замены юриста

    Впечатляющие успехи ML/DL:
    – синтаксический парсинг
    предложений (UDPipe, Stanford)
    – поиск именованных сущностей
    (BERT, DeepPavlov, spaCy)
    – генерация текста (GPT-2/3)

    View Slide

  4. 4
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?

    Святой Грааль — создать
    end-to-end решение:
    – на входе - юридическая практика
    (законы, судебные решения,
    договоры…)
    – на выходе - модель, способная
    решать сложные творческие задачи
    (оценка рисков, подготовка
    юридических документов…)

    View Slide

  5. 5
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?

    Воодушевленные успехами ML/DL
    data-scientist‘ы создали большое
    количество опасных проблем:
    – подмена понятий
    – «brain-dead» - модели
    – экспоненциальный рост затрат
    – акцент на решении бесполезных
    задач

    View Slide

  6. 6
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?

    Проблема № 1: ML/ANN ≠ Legal AI
    – «ничего страшного, что наши
    модели — это черный ящик, главное
    — оно РАБОТАЕТ»

    «ОК» там, где цена ошибки
    является невысокой / допустимой:
    чат-боты, развлечения, скоринг...

    Юристам нужен Explainable AI

    View Slide

  7. 7
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?
    Nigel Richards, 2015:
    - чемпион в Scrabble
    - запомнил все слова во
    французском словаре
    - не знает значения слов

    View Slide

  8. 8
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?

    Проблема № 2: «brain-dead» - модели (GPT-2/3...)

    Создаваемые модели не понимают смысл текста

    View Slide

  9. 9
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?

    Проблема № 3: взрывной рост расходов
    – 2,5K - 50K USD (110M параметров)
    – 10K - 200K USD (340M параметров)
    – 80K - 1,6M USD (1,5B параметров)
    – ...и продолжает расти:
    GPT-3 — 1,8 - 4,6M USD

    изначально ML — альтернатива
    дорогим методам обучения AI
    https://arxiv.org/pdf/2004.08900.pdf

    View Slide

  10. 10
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?

    Проблема № 4: задача << датасет
    – есть удобные дата-сеты: twitter, обзоры
    пользователей на фильмы, товары…
    – надо «найти» (придумать) задачу, для
    которой подошли бы наши дата-сеты
    – отличный кандидат — сделаем систему
    анализа тональности (sentiment analysis)!

    View Slide

  11. 11
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?

    Действительно сложные задачи, которые
    надо решить для создания Legal AI:
    – обучить Legal AI понимать наши цели
    – привить Legal AI наши цели
    – гарантировать, что Legal AI будет разделять
    наши цели

    View Slide

  12. 12
    OpenTalks.AI 2021:
    Почему машинное обучение
    препятствует развитию Legal AI?

    Предлагаемая архитектура Legal AI
    Оптическое распознавание
    текста (OCR)
    трансформация скан-копий в
    машиночитаемый
    формат
    Графовые системы знаний
    оцифрованная логика,
    знания и опыт экспертов
    предметной области
    Семантический анализ
    обработка текста,
    идентификация смыслов из
    содержания документов
    Результат
    логические
    суждения
    и выводы
    Первичная
    информация:
    скан-копии
    документов,
    внешние базы
    данных...
    Нейронные сети и
    машинное обучение
    генерация выводов и
    умозаключений на основе
    логики предметной области

    View Slide

  13. 13
    OpenTalks.AI 2021
    Q&A
    email: [email protected]
    Telegram: @ipostny

    View Slide