Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ПТАиМСС – магистратура, 2 курс осень 2021 – 1 з...

ТиМПИ
September 03, 2021

ПТАиМСС – магистратура, 2 курс осень 2021 – 1 занятие

ТиМПИ

September 03, 2021
Tweet

More Decks by ТиМПИ

Other Decks in Research

Transcript

  1. Прикладные технологии анализа и моделирования социальных сетей: сложные сети Валерий

    Дмитриевич Олисеенко ассистент кафедры информатики dscs.pro; csd.spbu.ru
  2. dscs.pro 2/39 ОБЪЕКТ, ПРЕДМЕТ, ЦЕЛЬ Социальная сеть — социальная структура,

    состоящая из множества агентов (индивидуальных или коллективных) и определенной на ней множества отношений (совокупности связей между агентами)1. 1) Объект исследования — социальные сети; 2) Предмет исследования —онлайн-платформы (ВКонтакте, Facebook, Instagram); 3) Цель — характеризующая информация о социальных сетях. 1Губанов Д. А., Новиков Д. А., Чхартишвили А. Г. Социальные сети: модели информационного влияния, управления и противоборства.
  3. dscs.pro 4/39 ПРОБЛЕМЫ • Качество пользовательского контента (спам, ложная информация,

    скрытые данные, фейки); • Проблемы с обеспечением приватности личных данных при хранении и обработке; • Частые обновления пользовательской модели и функционала; • Размерность данных.
  4. dscs.pro 5/39 РАЗМЕРНОСТЬ ДАННЫХ 1 млрд пользовательских аккаунтов Facebook1; 100

    млрд связей между ними; 200 млн фотографий ежедневно; 2 млрд комментариев ежедневно. Наши эксперименты: Изначально — 500 пользователей; Их друзья — 276831 пользователей; Друзья друзей — 125 млн. пользователей2; Рост ~𝑥𝑛, где 𝑥 — число пользователей, 𝑛 — “глубина” друзей. 2Во ВКонтакте зарегистрировано более 460 миллионов пользователей 1Ссылка на статью
  5. dscs.pro 6/39 СБОР ДАННЫХ ИЗ СОЦИАЛЬНЫХ СЕТЕЙ • Приватность данных

    (доступ только для зарегистрированных пользователей, скрытые аккаунты/атрибуты); • Слабая структурированность данных (скудные API интерфейсы, получение данных из HTML обработка AJAX); • Ограничение доступа.
  6. dscs.pro 7/39 ЗАДАЧИ • Поиск описаний событий; • Определение тональностей

    текстов; • Идентификация пользователей различных социальных сетей; • Поиск сообществ пользователей; • Измерение информационного влияния; • Восстановление атрибутов профиля; • Психологический/психический анализ пользователей.
  7. dscs.pro 8/39 ИСТОЧНИКИ • Абрамов М.В., Тулупьев А.Л. dscs.pro •

    Котенко И.В. • Турдаков Д.Ю., Гомзин А.Г. • Коршунов А.В. СПб ФИЦ РАН
  8. dscs.pro 9/39 ИСТОРИЧЕСКИЕ ПРЕДПОСЫЛКИ • Социология (30–40е года)1; • Математика

    (50–60е года); • Компьютерные науки (70е годы); • Статистическая физика; • Экономика (00е годы). 1Barnes J. A. Class and Committees in Norwegian Island Parish // Human Relations. New York: Hafner Press, 1975.
  9. dscs.pro 10/39 ТЕРМИНЫ • Сеть — граф; • Узлы —

    вершины, акторы; • Связи — рёбра, отношения; • Кластеры — сообщества.
  10. dscs.pro 11/39 СЛОЖНЫЕ СЕТИ • Сеть = узлы + рёбра;

    • Не регулярны, но не случайны; • Сложная (нетривиальная) топология; • Безразмерные (масштабно- инвариантные) сети; • Универсальные свойства; • Везде; • Независимые агенты (?).
  11. dscs.pro 21/39 ГРАФЫ И СЕТИ • Граф 𝐺(𝑉; 𝐸), 𝑉

    — вершины, 𝑚 = |𝑉|, 𝐸 — рёбра, 𝑛 = |𝐸|; • Направленность, простые (без циклов), взвешенность; • Связный, сильно-связный и слабо-связный граф; • Связный компонент — максимально связный подграф; • Путь — последовательность рёбер, которые соединяют некую последовательность узлов (простой путь, без циклов); • Геодезическое расстояние — кратчайший путь между двумя узлами; • Средний кратчайший путь (цепочка, звезда, полный); • Диаметр графа — наибольшее кратчайшее расстояние (два узла, отстоящие дальше всех друг от друга); • Степень узла 𝑘 𝑖 — количество ближайших соседей; • Распределение степеней узлов 𝑃(𝑘).
  12. dscs.pro 22/39 ПРЕДСТАВЛЕНИЯ • В виде графа G(n;m); • В

    виде матрицы связности Aij i→j.
  13. dscs.pro 23/39 СЛОЖНЫЕ СЕТИ: СВОЙСТВА • Распределение степеней узлов; •

    Диаметр сети; • Локальная структура (плотность) графа (транзитивность); • Наличие гигантской связной компоненты ; • Иерархическая структура; • Кластерные структуры.
  14. dscs.pro 32/39 ИДЕЯ МАЛОГО МИРА • "The small-world problem". Stanley

    Milgram, 1967 • "An experimental study of the small world problem J. Travers, S. Milgram, 1969
  15. dscs.pro 33/39 ЭКСПЕРИМЕНТ СТЭНЛИ МИЛГРАМА 1969 ГГ. 1/3 • 296

    волонтёров, 217 отправлено; • 196 в Небраска (1300 миль); • 100 в Бостон (25 миль); • Адресат был в Бостоне; • Имя, род деятельности, работа, родной город.
  16. dscs.pro 35/39 ЭКСПЕРИМЕНТ СТЭНЛИ МИЛГРАМА 1969 ГГ. 3/3 • Количество

    писем, дошедших до адресата 𝑁 = 64,29%; • Средний кратчайший путь < 𝐿 > = 5.2; • Первый канал: через родной город < 𝐿 > = 6.1; • Второй канал: бизнес контакты < 𝐿 > = 4.6; • Из Бостона < 𝐿 > = 4.4; • Из Небраска < 𝐿 > = 5.7.
  17. dscs.pro 36/39 СЛОЖНЫЕ СЕТИ • Email граф: D. Watts (2001),

    48,000 отправителей, < 𝐿 > ≈ 6; • Граф MSN Messenger: J. Lescovec и др. (2007), 240млн пользователей, < 𝐿 > ≈ 6.6; • Граф Facebook: L. Backstrom и др. (2012), 721 млн пользователей, < 𝐿 > ≈ 4.74.
  18. dscs.pro 37/39 РЕШЁТКА БЕТЕ (ДЕРЕВО КЭЙЛИ) Решётка Бете: дерево или

    бесконечный граф без циклов, где каждый узел связан с фиксированным числом соседей 𝑧 • количество узлов на уровне 𝑘 𝑁 𝑘 = 𝑧(𝑧 − 1)𝑘−1; • общее количество узлов 𝑁 = 1 + σ1 𝐿 𝑧(𝑧 − 1)𝑘−1; • Оценка: 𝑧𝐿 = 𝑁, 𝐿 = log 𝑁 / log 𝑧 𝑁 ≈ 6.7 𝑏𝑙𝑛, 𝑧 = 50 друзей, 𝐿 ≈ 5.8.
  19. dscs.pro 38/39 ЛИТЕРАТУРА • "Networks: An Introduction". Mark Newman. Oxford

    University Press, 2010; • "Social and Economic Networks". Matthew O. Jackson. Princeton University Press, 2010; • "Networks, Crowds, and Markets: Reasoning About a Highly Connected World". David Easley and John Kleinberg, Cambridge University Press 2010.; • "Social Network Analysis. Methods and Applications". Stanley Wasserman and Katherine Faust, Cambridge University Press, 1994.
  20. Прикладные технологии анализа и моделирования социальных сетей: сложные сети Валерий

    Дмитриевич Олисеенко ассистент кафедры информатики dscs.pro; csd.spbu.ru