Slide 1

Slide 1 text

Интеллектуальные информационные системы на основе семантических технологий или семантическая интерпретация BigData или системы искусственного интеллекта на основе инженерии знаний Исаев Сергей www.DataFabric.cc

Slide 2

Slide 2 text

#Семантические сети (Семантика данных) #Графы знаний #Графовые базы данных (RDF-триплеты) #Linked Data #Онтологическое моделирование Про что это вообще?

Slide 3

Slide 3 text

Информационно-справочные системы Главное функциональное назначение: - Возможность поиска информации в данных Полнотекстовый поиск по содержимому текстов или различные комбинации фильтров.

Slide 4

Slide 4 text

Информационно-справочные системы Главная фундаментальная проблема: - Система не может понимать смысл запроса Для системы все равно – 0 или 1, А или Б Система делает только то, что в нее заложено (запрограммировано), не понимая смысла.

Slide 5

Slide 5 text

Проблема работы с информацией - Чаще всего человек сам не знает что он ищет. - Получение информации происходит в процессе исследования.

Slide 6

Slide 6 text

Интеллектуальные информационные системы Система должна понимать смысл запроса Понимать в понятиях человека Обращение в систему на логическом уровне: - Какая налоговая ставка у меня будет, если я стану резидентом Сколково? Ответ – Одно число, а не все документы с «налоговая ставка»

Slide 7

Slide 7 text

Работать со знаниями, а не с данными Чем знания отличаются от данных?

Slide 8

Slide 8 text

RDF-триплеты

Slide 9

Slide 9 text

Как связана «Alice» с «Da Vinci» ?

Slide 10

Slide 10 text

Пример хранения знаний ФНС

Slide 11

Slide 11 text

Онтологическое моделирование предметной области Обучение системы через описание области компетенций – делаем структуру мира Мы сами рассказываем машине что означают те или иные данные. Обучая машину, мы перекладываем на нее задачу понимать смысл данных. С человека на машину.

Slide 12

Slide 12 text

Machine Learning У нас есть данные -> Мы обучаем систему Онтологическое моделирование Мы обучаем систему -> Система понимает данные

Slide 13

Slide 13 text

Онтология Онтологии позволяют формально описать предметную область, связать множество таких описаний друг с другом, использовать описание для аннотирования данных. Таким образом, данные становятся связанными как с общими знаниями, так и с другими данными, обеспечивается интерпретация данных на машинном уровне. Linked Data – Связанные данные

Slide 14

Slide 14 text

Онтология Использование стандартов позволяет комбинировать различные информационные системы на уровне понятий не прибегая к явному сопоставлению вида: "Колонка 1 таблицы А является тем же самым что колонка 3 в Таблице Б"

Slide 15

Slide 15 text

No content

Slide 16

Slide 16 text

Онтология ЕГР ФНС Описывает понятие юридического лица и индивидуального предпринимателя

Slide 17

Slide 17 text

На фрагменте видно, что класс EGRIP_RegEntity является суперклассом для класса NameAndGenderEntity, Который, в свою очередь, имеет несколько атрибутов (например, foaf:name). Префикс foaf в данном случае означает, что для описания атрибута используется стандартизированная онтология FriendOfAFriend, использующаяся для описания человека и связей внутри группы лиц. Таким образом, онтология определяет а) Классы (понятия) - (человек, записьВРеестре, компания) б) Атрибуты – (пол, имя, юридическоеНазвание) в) Отношения - (основал, являетсяПравопреемником)

Slide 18

Slide 18 text

SPARQL – логический API Доступ к данным на логическом уровне Отец Сын Иван Сын Петр Вычисляемые связи Обратное тождество Братья Сергей София Отец Дочь

Slide 19

Slide 19 text

Кейс – связи компаний из ФНС tree.datafabric.cc Semantic Tech inside

Slide 20

Slide 20 text

No content

Slide 21

Slide 21 text

Исаев Сергей ООО «ДатаФабрик» Сайт: DataFabric.cc Тел: +7 (921) 345-65-43 Почта: [email protected] Системы визуальной аналитики бизнес информации