Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Построение информационных систем на основе семантических сетей. #Графы знаний, #Semantic web, Сергей Исаев, ДатаФабрик, CEE-SECR 2017

CEE-SECR
October 21, 2017

Построение информационных систем на основе семантических сетей. #Графы знаний, #Semantic web, Сергей Исаев, ДатаФабрик, CEE-SECR 2017

1. Онтологическое моделирование предметной области.
2. Графовые базы данных и хранение данных в виде RDF-триплетов.
3. Обращение к данным (БД) на логическом уровне.
4. Графические интерфейсы в виде графов знаний.
5. Плюсы и минусы использования семантических сетей.

Мы разрабатываем интеллектуальные информационные системы, в основе которых лежат семантические сети (Semantic web). В России подобных проектов не более 5-10.

Доклад рассчитан на разработчиков ПО, архитекторов ПО, Технических директоров. Он рассчитан на самую широкую техническую публику и не слишком сложен в понимании – это визионерский доклад. Доклад дает вводное представление о технологии семантических сетей и какие возможности они дают при работе с данными, построению на их основе информационных систем.

CEE-SECR

October 21, 2017
Tweet

More Decks by CEE-SECR

Other Decks in Technology

Transcript

  1. Интеллектуальные информационные системы
    на основе семантических технологий
    или семантическая интерпретация BigData
    или системы искусственного интеллекта на основе инженерии знаний
    Исаев Сергей
    www.DataFabric.cc

    View Slide

  2. #Семантические сети (Семантика данных)
    #Графы знаний
    #Графовые базы данных (RDF-триплеты)
    #Linked Data
    #Онтологическое моделирование
    Про что это вообще?

    View Slide

  3. Информационно-справочные системы
    Главное функциональное назначение:
    - Возможность поиска информации в данных
    Полнотекстовый поиск по содержимому текстов
    или различные комбинации фильтров.

    View Slide

  4. Информационно-справочные системы
    Главная фундаментальная проблема:
    - Система не может понимать смысл запроса
    Для системы все равно – 0 или 1, А или Б
    Система делает только то, что в нее заложено
    (запрограммировано), не понимая смысла.

    View Slide

  5. Проблема работы с информацией
    - Чаще всего человек сам не знает что он ищет.
    - Получение информации происходит в
    процессе исследования.

    View Slide

  6. Интеллектуальные информационные системы
    Система должна понимать смысл запроса
    Понимать в понятиях человека
    Обращение в систему на логическом уровне:
    - Какая налоговая ставка у меня будет, если я стану
    резидентом Сколково?
    Ответ – Одно число, а не все документы с «налоговая ставка»

    View Slide

  7. Работать со знаниями, а не с данными
    Чем знания отличаются от данных?

    View Slide

  8. RDF-триплеты

    View Slide

  9. Как связана «Alice» с «Da Vinci» ?

    View Slide

  10. Пример хранения знаний ФНС

    View Slide

  11. Онтологическое моделирование
    предметной области
    Обучение системы через описание области
    компетенций – делаем структуру мира
    Мы сами рассказываем машине что означают те или иные данные.
    Обучая машину, мы перекладываем на нее задачу понимать смысл
    данных. С человека на машину.

    View Slide

  12. Machine Learning
    У нас есть данные -> Мы обучаем систему
    Онтологическое моделирование
    Мы обучаем систему -> Система понимает данные

    View Slide

  13. Онтология
    Онтологии позволяют формально описать предметную
    область, связать множество таких описаний друг с другом,
    использовать описание для аннотирования данных.
    Таким образом, данные становятся связанными как с общими
    знаниями, так и с другими данными, обеспечивается
    интерпретация данных на машинном уровне.
    Linked Data – Связанные данные

    View Slide

  14. Онтология
    Использование стандартов позволяет комбинировать
    различные информационные системы на уровне понятий
    не прибегая к явному сопоставлению вида:
    "Колонка 1 таблицы А является тем же самым
    что колонка 3 в Таблице Б"

    View Slide

  15. View Slide

  16. Онтология ЕГР ФНС
    Описывает понятие юридического лица
    и индивидуального предпринимателя

    View Slide

  17. На фрагменте видно, что класс EGRIP_RegEntity является
    суперклассом для класса NameAndGenderEntity,
    Который, в свою очередь, имеет несколько атрибутов
    (например, foaf:name).
    Префикс foaf в данном случае означает, что для описания атрибута
    используется стандартизированная онтология FriendOfAFriend,
    использующаяся для описания человека и связей внутри группы лиц.
    Таким образом, онтология определяет
    а) Классы (понятия) - (человек, записьВРеестре, компания)
    б) Атрибуты – (пол, имя, юридическоеНазвание)
    в) Отношения - (основал, являетсяПравопреемником)

    View Slide

  18. SPARQL – логический API
    Доступ к данным на логическом уровне
    Отец
    Сын Иван
    Сын Петр
    Вычисляемые связи Обратное тождество
    Братья Сергей София
    Отец
    Дочь

    View Slide

  19. Кейс – связи компаний из ФНС
    tree.datafabric.cc
    Semantic Tech inside

    View Slide

  20. View Slide

  21. Исаев Сергей
    ООО «ДатаФабрик»
    Сайт: DataFabric.cc
    Тел: +7 (921) 345-65-43
    Почта: [email protected]
    Системы визуальной аналитики
    бизнес информации

    View Slide