Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Redes Complexas - Modelo para Comentários do Reddit

Redes Complexas - Modelo para Comentários do Reddit

Work related to the Complex Network class at UFRJ

New presentation: https://pboueke.github.io/presentations/rtm/reddit.html#/

https://github.com/Thurler/reddit-tree-model

Pedro Boueke

June 06, 2017
Tweet

More Decks by Pedro Boueke

Other Decks in Research

Transcript

  1. Redes Complexas Um modelo para a representação de redes de

    comentários criado a partir do estudo das distribuições empíricas da rede do Reddit UFRJ 2017.1 Guilherme Thurler Pedro Boueke
  2. O Dataset 15 milhões de comentários Limitando por subreddit... Grafo

    ocupa 4GB em memória Algoritmos levam dias para terminar 400 mil comentários Grafo ocupa 100MB em memória Algoritmos levam minutos para terminar
  3. Simulação p: 0.01 p: 0.1 p: 0.05 p: 0.5 p:

    0.01 p: 0.05 p: 0.5 p: 0.1 t = 1000
  4. t = 1000 Distribuição de vértices por altura Simulação (valores

    obtidos a partir de múltiplas execuções) Distribuição de grau
  5. Simulação t: 1000 p: 0.001 n: 228 t: 1000 p:

    0.001 n: 380 t: 1000 p: 0.001 n: 100 t: 1000 p: 0.001 n: 1 . t: 1000 p: 0.001 n: 5 Variação de N Altura x Largura t x p
  6. Modelo x Realidade r/explainmelikeimfive p2 com t*p=1 p1 com t*p=1

    CCDF Altura CCDF Grau Comparações fora de contexto: árvores médias contra parametrizações estáticas
  7. Árvore real: r/worldnews Tamanho médio: 36 Árvore real: r/worldnews Tamanho

    máximo: 8088 Árvore gerada: p1: 0.001, t:10000 Tamanho: 33 Árvore gerada: p2: 0.001, t:20000 Tamanho: 8724 Modelo x Realidade
  8. Trabalhos Futuros Perguntas? Realizar um estudo analítico do modelo para

    validar observações. Modelar não só threads, mas também postagens e subreddits. Realizar estudo de mais configurações, métricas e processos de geração.