OpenTalks.AI - Игнат Постный, Почему машинное обучение препятствует развитию Legal AI?

OpenTalks.AI 2021 Почему машинное обучение препятствует развитию Legal AI?

OpenTalks.AI 2021 • Постный Игнат Алексеевич: – партнер и исполнительный
директор TAG Consulting – +10 лет опыта в сфере «legal high-end» – эксперт в области цифровой трансформации бизнеса • email: [email protected] • Telegram: @ipostny

3 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?
• Legal AI — narrow AI для замены юриста • Впечатляющие успехи ML/DL: – синтаксический парсинг предложений (UDPipe, Stanford) – поиск именованных сущностей (BERT, DeepPavlov, spaCy) – генерация текста (GPT-2/3)

• Святой Грааль — создать end-to-end решение: – на входе - юридическая практика (законы, судебные решения, договоры…) – на выходе - модель, способная решать сложные творческие задачи (оценка рисков, подготовка юридических документов…)

• Воодушевленные успехами ML/DL data-scientist‘ы создали большое количество опасных проблем: – подмена понятий – «brain-dead» - модели – экспоненциальный рост затрат – акцент на решении бесполезных задач

• Проблема № 1: ML/ANN ≠ Legal AI – «ничего страшного, что наши модели — это черный ящик, главное — оно РАБОТАЕТ» • «ОК» там, где цена ошибки является невысокой / допустимой: чат-боты, развлечения, скоринг... • Юристам нужен Explainable AI

Nigel Richards, 2015: - чемпион в Scrabble - запомнил все слова во французском словаре - не знает значения слов

• Проблема № 2: «brain-dead» - модели (GPT-2/3...) • Создаваемые модели не понимают смысл текста

• Проблема № 3: взрывной рост расходов – 2,5K - 50K USD (110M параметров) – 10K - 200K USD (340M параметров) – 80K - 1,6M USD (1,5B параметров) – ...и продолжает расти: GPT-3 — 1,8 - 4,6M USD • изначально ML — альтернатива дорогим методам обучения AI https://arxiv.org/pdf/2004.08900.pdf

• Проблема № 4: задача << датасет – есть удобные дата-сеты: twitter, обзоры пользователей на фильмы, товары… – надо «найти» (придумать) задачу, для которой подошли бы наши дата-сеты – отличный кандидат — сделаем систему анализа тональности (sentiment analysis)!

• Действительно сложные задачи, которые надо решить для создания Legal AI: – обучить Legal AI понимать наши цели – привить Legal AI наши цели – гарантировать, что Legal AI будет разделять наши цели

• Предлагаемая архитектура Legal AI Оптическое распознавание текста (OCR) трансформация скан-копий в машиночитаемый формат Графовые системы знаний оцифрованная логика, знания и опыт экспертов предметной области Семантический анализ обработка текста, идентификация смыслов из содержания документов Результат логические суждения и выводы Первичная информация: скан-копии документов, внешние базы данных... Нейронные сети и машинное обучение генерация выводов и умозаключений на основе логики предметной области

13 OpenTalks.AI 2021 Q&A email: [email protected] Telegram: @ipostny

OpenTalks.AI - Игнат Постный, Почему машинное о...

OpenTalks.AI - Игнат Постный, Почему машинное обучение препятствует развитию Legal AI?

opentalks3

More Decks by opentalks3

Other Decks in Business

Featured

Transcript

OpenTalks.AI 2021 Почему машинное обучение препятствует развитию Legal AI?

OpenTalks.AI 2021 • Постный Игнат Алексеевич: – партнер и исполнительный

3 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

4 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

5 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

6 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

7 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

8 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

9 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

10 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

11 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

12 OpenTalks.AI 2021: Почему машинное обучение препятствует развитию Legal AI?

13 OpenTalks.AI 2021 Q&A email: [email protected] Telegram: @ipostny