e colocados à disposição das pessoas de forma a tornar possível não apenas sua leitura e acompanhamento, mas também sua reutilização em novos projetos, sítios e aplicativos; seu cruzamento com outros dados de diferentes fontes; e sua disposição em visualizações interessantes e esclarecedoras (W3C Brasil) 7
2011) • Assegura o acesso à informação mediante processos ágeis, de modo transparente e claro • A publicação a ser obrigação do Estado, regulamentada por lei 9
e Variedade Volume Não-estruturado Semi-estruturado Estruturado Terabytes … Exabytes Batch Tempo Real Janela de tempo onde podemos usar os dados Estado verdadeiro da realidade Analise Estratégica de Dados
"likes", 219B de fotos e 140.3B de relacionamentos ❑ Youtube: 100 horas de vídeos adicionado a cada minuto ❑ Twitter: 80 TB e 1B de tweets por dia ❑ Boeing: 640 TB gerados em um voo transatlântico ❑ Wal-Mart: 2,5 PB e 1 milhão de transações/hora 13
Federal: (1) Alta dimensionalidade (2) Grande volume de dados (difícil abrir em uma ferramenta de planilha) (3) Algumas questões não possuem informações (Ex.: o inscrito não sabia respondê-las) (4) Tipos de dados diferentes (nominal, numérico,...) (5) Difícil tomada de decisões (6) O esquema pode modificar, o que fazer? (7) Qual o formato adequado para publicar essas informações? (8) Questões destinadas a um público específico 15
Veloso, Wagner Meira Jr., Virgílio Almeida, Fabrício Benevenuto, Fernanda Ferraz, Mauro Teixeira: Dengue Surveillance Based on a Computational .Model of Spatio-temporal Locality of Twitter. WebSci 2011: 1-8 20
Croácia (1º jogo) Fonte: José Adail Carvalho Filho, João Lucas Leite, Ticiana L. Coelho da Silva: Desenvolvimento de um modelo de classificação de tweets para analisar as opiniões de usuários do Twitter sobre osjogos da .Seleção Brasileira de Futebol na Copa do Mundo da FIFA Brasil 2014. ENUCOMP 2014
México (2º jogo) Fonte: José Adail Carvalho Filho, João Lucas Leite, Ticiana L. Coelho da Silva: Desenvolvimento de um modelo de classificação de tweets para analisar as opiniões de usuários do Twitter sobre osjogos da .Seleção Brasileira de Futebol na Copa do Mundo da FIFA Brasil 2014. ENUCOMP 2014
Camarões (3º jogo) Fonte: José Adail Carvalho Filho, João Lucas Leite, Ticiana L. Coelho da Silva: Desenvolvimento de um modelo de classificação de tweets para analisar as opiniões de usuários do Twitter sobre osjogos da .Seleção Brasileira de Futebol na Copa do Mundo da FIFA Brasil 2014. ENUCOMP 2014
Chile (4º jogo) Fonte: José Adail Carvalho Filho, João Lucas Leite, Ticiana L. Coelho da Silva: Desenvolvimento de um modelo de classificação de tweets para analisar as opiniões de usuários do Twitter sobre osjogos da .Seleção Brasileira de Futebol na Copa do Mundo da FIFA Brasil 2014. ENUCOMP 2014
Colômbia (5º jogo) Fonte: José Adail Carvalho Filho, João Lucas Leite, Ticiana L. Coelho da Silva: Desenvolvimento de um modelo de classificação de tweets para analisar as opiniões de usuários do Twitter sobre osjogos da .Seleção Brasileira de Futebol na Copa do Mundo da FIFA Brasil 2014. ENUCOMP 2014
Alemanha (6º jogo) Fonte: José Adail Carvalho Filho, João Lucas Leite, Ticiana L. Coelho da Silva: Desenvolvimento de um modelo de classificação de tweets para analisar as opiniões de usuários do Twitter sobre osjogos da .Seleção Brasileira de Futebol na Copa do Mundo da FIFA Brasil 2014. ENUCOMP 2014
Holanda (7º jogo) Fonte: José Adail Carvalho Filho, João Lucas Leite, Ticiana L. Coelho da Silva: Desenvolvimento de um modelo de classificação de tweets para analisar as opiniões de usuários do Twitter sobre osjogos da .Seleção Brasileira de Futebol na Copa do Mundo da FIFA Brasil 2014. ENUCOMP 2014
Sustentá vel Fonte: Hinessa Dantas Caminha, Ticiana Coelho da Silva, Atslands Rego da Rocha, Sílvio Carlos R. Vieira Lima: Estimating Reference Evapotranspiration using Data Mining Prediction Models and Feature Selection. ICEIS (1) 2017
é complexo; ❑ Soluções atuais não tratam de forma adequada este volume ➢ Necessidade de paralelizar as soluções; ❑ Muitos desafios para Big Open Data: ➢ Armazenamento, processamento, análise, segurança, escalabilidade; ❑Grande motivação: levar informação e conhecimento às pessoas 40