Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Legal.AI - Роман Кошелев, Сбербанк, Искусственн...

Avatar for OpenTalks.AI OpenTalks.AI
September 19, 2019

Legal.AI - Роман Кошелев, Сбербанк, Искусственный интеллект в юридических процессах. Управление юридическими знаниями. Опыт Сбербанка.

Avatar for OpenTalks.AI

OpenTalks.AI

September 19, 2019
Tweet

More Decks by OpenTalks.AI

Other Decks in Business

Transcript

  1. Искусственный интеллект в юридических процессах. Управление юридическими знаниями. Опыт Сбербанка

    Роман Кошелев, Проектный офис Правового департамента ПАО Сбербанк
  2. Мотивация • Вызов – проводить ЮЭ за 7 минут. Человек

    не справляется. • Узким местом автоматизации юридической деятельности является невозможность прямого применения алгоритмов из-за специфики данных, которая заключается в том, что эти данные имеют сложную семантику и прежде чем принять решение, необходимо извлечь глубоко запрятанные в текстах смыслы, учесть множество связей, юридических нюансов и коллизий. • Ключом к решению являются технологии перевода юридических данных и знаний (интерпретируемых смыслов законов, договоров, норм и т.д.) в структурированное машиночитаемое представление.
  3. Мистер Уильямс, мистер Барнет и мистер Эдвардс — соседи. Один

    из них (Уильямс) — пекарь, другой (Барнет) — таксист, а третий (Эдвардс) — пожарный. Определите профессию каждого из них. Вот подсказки Мистер Уильямс, мистер Барнет и мистер Эдвардс — соседи. Один из них (Уильямс) — пекарь, другой (Барнет) — таксист, а третий (Эдвардс) — пожарный. Определите профессию каждого из них. Вот подсказки Примерный принцип извлечения Мистер Уильямс, мистер Барнет и мистер Эдвардс — соседи. Один из них (Уильямс) — пекарь, другой (Барнет) — таксист, а третий (Эдвардс) — пожарный. Определите профессию каждого из них. Вот подсказки Уильямс - пекарь Барнет - пекарь Эдвардс - пожарный Эдвардс - Барнет пекарь - таксист мистер - пожарный пожарный - пекарь Уильямс - Эдвардс Соседи: ФИО: Уильямс Прф: пекарь Обр: мистер ФИО: Барнет Прф: таксист Обр: мистер ФИО: Эдвардс Прф: пожарный Обр: мистер Текст Концептуальные единицы (КЕ) Блоки Попарные связи Heatmap парных связей Граф возможных фактов Извлеченные знания
  4. Модуль Склейки (актуализации документов) Данные Обучаемые алгоритмы на основе Deep

    NLP Документ Сегментатор правок Классификатор правок Экстрактор параметров Обновленный документ Правки Обучающий Датасет Исполнитель действий Включает документы и правки к ним, размеченные особым образом. Вначале искусственный, чтобы проверить пайплайн. Затем используем подготовленный разметчиками датасет и тренируем на нем. Делит сырой текст изменений на блоки, где каждый блок соответствует одной правке Присваивает каждой правке класс, например, Исправление, Замена, Удаление блока и пр. Находит в тексте правок необходимые параметры, такие как номер пункта, подпункта, текст правки и пр Находит нужный кусок текста в исходном документе и производит необходимые правки вызывая скрипты действий Корректор ошибок Исправляет ошибки некорректного распознавания текста Скрипты действий (Python)
  5. Правовая экспертиза кредитной сделки Скрипты правил (Python) Извлечение Фактов OCR

    Сканы Докуме нтов HTML Документы Извлечение фактов Факты Из Док-ов Применение Правил Юр. Заключ ение Юрист-Эксперт Склейка Документов Станция верификации
  6. Немного цифр о Роботе Юристе • Робот подготовил 444,071 юридическое

    заключение • Анализирует 15 типов документов • Извлекает 891 вид юридических фактов и 1257 сущностей (атрибутов) • Объединяет Уставы, ВНД и Трудовые договоры • Делает заключение на основе логики, которая содержит 110 видов проверок, состоящих из 2139 логических операций. • На извлечение фактов из одного комплекта уходит 90 секунд, на склейку 60 сек, на принятие решения – 15 секунд. • На один запрос человек в среднем затрачивает 2,2 часа • Робот, работая без выходных и обеда, обрабатывает 57,5 запросов в час • Один робот справляется с работой 350 человек Статистика за 8 месяцев 2019 года участия РЮ в правовой экспертизе кредитного процесса:
  7. Развитие платформы УЮЗ LEGAL_AI Разметка Верификация Процессы Данные Модели Интеграция

    Сервисная шина Система РМ Юриста OCR Фабрика моделей API API API API API API API API API API IT-Ресурсы Станция Авторазметка Анализ качества Импорт/экспорт Раб. место Runtime Deploy Tests Storage Станция Предсказание Кеширование Дообучение Польз. панель Auto ML Задания на разметку Анализ качества Импорт/экспорт Сервера Сетевые диски GPU etc. Конфигуратор Диспетчер Роли и права События Интеграция с ERP Реестр NLP/GNN модели Confidence Склейка Qlty prediction Раб. место ABBYY Tesseract Барьер качества Очередь задач Мониторы Диспетчера Cl, DevOps Панель упр-ия Реестр Бэкапы Аналитика Датасеты Банковские АС Корп. ERP системы Гос. сервисы Amazon, Google Позволяет автоматизировать создание и тестирование новых моделей обработки знаний силами юристов, с минимальным привлечением датасайентистов Компоненты могут быть развернуты не только внутри банка, но и в облаке и на площадках клиентов Каждый модуль имеет свой API, локальное хранилище данных, набор AI-сервисов, пользовательский интерфейс и может быть отделен и интегрирован в банковские платформы и сторонние системы Специфические компоненты распознавания текста, шаблоны ABBYY, настройки Tesseract, моделей оценки и исправления Шина обеспечивает взаимодействие отдельных модулей через их API Подключает юристов для проверки и исправления результатов на этапе ПРОМ, оптимизирует работу и дообучает AI-модели Инструменты и сервисы для подготовки ТЗ, создания, тестирования и передачи в ПРОМ юридических правил на специальном DSL языке Модуль разметки юридических занний может быть интегрирован в общебанковский разметчик Позволяет описывать, конфигурировать, запускать и мониторить юридические процессы, например, проверку правосопособности Модуль конфигурирует и обновляет комплекс, следит за ресурсами, работоспособностью и производительностью подсистем Здесь сосредоточены реестр моделей, инструменты тренировки и валидации, пайплайны для конкретных решений Содержит общие данные для всех модулей Позволяет получать внешние данные и вызывать сервисы. Дает доступ к сервисам извне. Роли, процессы
  8. Пример процесса на пл. LEGAL_AI АС Облако данных Создание и

    обучение моделей, датасайентисты Разметка данных, стажеры-юристы Написание правил для робота, ЮА Логика РЮ на DSL Ввод запроса бизнес- подразделением Подготовка моделей и логики Промышленное использование OCR Online Learning работы моделей, стажеры-юристы Online Learning распознавания текста, стажеры не-юристы ML Часть работы выполняется заранее и один раз (разметка данных, обучение моделей и создание правил РЮ), другая часть делится на квалифицированную (проверка и коррекция заключения) и вспомогательную работу (проверка распознавания текста, выделения сущностей и т.п.). Это решение разделяет компетенции, повышает скорость и качество процесса, позволяет многократно переиспользовать опыт, данные и алгоритмы. РЮ Confidence, Проверка заключения, юрист-эксперт Внешние данные: ФНС, Росреестр, ...