Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Flink (Peter Mika) - Semantic Web

Junior Grossi
December 06, 2013

Flink (Peter Mika) - Semantic Web

My presentation on my Masters (UFMG, pt_BR) about the Peter Mika's paper "Semantic Web Technology for the Extraction and Analysis of Social Networks".

Junior Grossi

December 06, 2013
Tweet

More Decks by Junior Grossi

Other Decks in Research

Transcript

  1. Junior Grossi && Paloma Diesel Dezembro/2013 | PPGCI UFMG Semantic

    Web Technology for the Extraction and Analysis of Social Networks Peter Mika, 2005 Flink
  2. Peter Mika? • Yahoo! Research (Barcelona, Espanha) • Semantic Web,

    Search, Web Mining • Flink (2005) - Web - Java • Livro "Social Networks and the Semantic Web" (2007)
  3. Flink (Origem) • Sucesso da Web ◦ Divulgação de informações

    pessoais ◦ Redes Sociais (Friendster - 5M users [2005]) • Redes Sociais ◦ Informações comuns entre os sites ◦ Os mesmos dados mantidos em sites diferentes
  4. Flink (Origem) • FOAF Project (www.foaf-project.org) ◦ Iniciativa parte do

    usuário ◦ Semântica dos dados pessoais ▪ Links nas páginas (meta tag) ▪ rdfs:seeAlso Pessoa Pessoa Pessoa
  5. Flink (Origem) • Utilizar FOAF ◦ Formar "Social Intellingence" ◦

    Coletar informações pessoais de pesquisadores ▪ Web pages, e-mails, publicações ◦ "FOAF ontology" • 608 pesquisadores de Web Semântica ◦ Links de um pesquisador ▪ Informações pessoais ▪ "Rede Social de Pesquisador"
  6. Flink • Dados Coletados (cada pesquisador) ◦ Informações pessoais ◦

    Localização geográfica ◦ Interesses ◦ Participação em eventos de Web Semântica ◦ Publicações escritas sobre Web Semântica • Resultados ◦ 5147 publicações ◦ 8185 mensagens para grupos de discussão
  7. Recursos • Web mining (Google) ◦ Conferir área de atuação

    de pesquisador ▪ Crawler ▪ Google Mindshare (#) • NP Interesses / NP Pesquisador (>=0) • FOAF ◦ Crawler RDF para coletar perfis (scutter) ◦ Análise das triplas com predicados RDF, RDFs
  8. Recursos • E-mails ◦ Download POP3 ou IMAP ◦ Header

    capturado em RDF • Publicação ◦ Google Scholar
  9. • Sesame Server (http://openrdf.org) ◦ Deploy de RDF ▪ SQL

    DB, filesystem, in-memory, etc ◦ Suporta SPARQL ◦ Suporta milhões de triplas Armazenamento
  10. Trabalhos Relacionados • Ontology-based knowledge management ◦ On-To-Knowledge && SEKT

    Project ◦ Coleta de dados manualmente ▪ Entrevistas e questionários • Emails como foco principal • FOAF ◦ Paolillo && Wright
  11. Conclusão e Trabalho Futuro • Desafios 1. Extração, representação e

    agregação de informações sociais 2. Ontologia Social ▪ Classificar relacionamentos 3. Criação de padrões sociais ▪ Identificar relacionamentos ▪ Utilizando dados eletrônicos • + Performance • + Escalabilidade Horizontal