Slide 1

Slide 1 text

NLP НЕЙРОСЕТИ 
 В ЗАЩИТЕ ДАННЫХ:

Slide 2

Slide 2 text

ОБО МНЕ Старший специалист по машинному обучению 
 
 Makves (входит в группу компаний «Гарда») 
 
 CV, NLP, ASR etc 
 
 Open source contributor 
 
 Амбассадор Яндекс Практикума 
 
 Выпускник DLS МФТИ

Slide 3

Slide 3 text

СОКРАЩЕНИЯ DCAP Data-Centric Audit and Protection NER Named Entity Recognition NLP Natural Language Processing SOTA State of the Art

Slide 4

Slide 4 text

ЗАДАЧА

Slide 5

Slide 5 text

НЕСТРУКТУРИРОВАННЫЕ ДАННЫЕ

Slide 6

Slide 6 text

Категория Информационные объекты Договор Техническое задание Квитанция Другое Другое Договор Иванов И. И. ООО Ромашка ООО Ромашка, Иванов И. И. Петров П. П. Иванов И. И. ООО Иванов и партнёры Название файла ДОГОВОР_ФИНАЛ.DOC НОВЫЙ ФАЙЛ (3).RTF РОМАШКА_ПЛАТЁЖКА.XLSX ПЕРЕДЕЛКА_НОВАЯ.DOCX ПРАВКИ ЗАКАЗЧИК.DOCX ДОГОВОР_ФИНАЛ_ФИНАЛ.DOC

Slide 7

Slide 7 text

КЛАССИФИКАЦИЯ

Slide 8

Slide 8 text

КЛАССИФИКАЦИЯ Количество файлов по выборкам

Slide 9

Slide 9 text

КЛАССИФИКАЦИЯ Количество файлов по выборкам

Slide 10

Slide 10 text

КЛАССИФИКАЦИЯ Количество файлов по выборкам

Slide 11

Slide 11 text

NAMED ENTITY RECOGNITION

Slide 12

Slide 12 text

NER

Slide 13

Slide 13 text

NER

Slide 14

Slide 14 text

NER

Slide 15

Slide 15 text

Иванов Иван Иванови является одним из ведущих специалистов в области информационных технологий. Он обладает обширным опытом работы и глубокими знаниями в своей сфере деятельности. Иванов успешно руководит проектами, связанными с разработкой программного обеспечения и управлением IT-инфраструктурой. Благодаря своему профессионализму и умению находить инновационные решения, он внес значительный вклад в развитие НОРМАЛИЗАЦИЯ

Slide 16

Slide 16 text

SOTA не всегда подходит Метрики могут просесть Сбор данных = инсайты 12 ВЫВОДЫ

Slide 17

Slide 17 text

MAKVES Российский разработчик программного обеспечения