Slide 1

Slide 1 text

BIG DATA Seus problemas estão apenas começando Thiago Gonzaga Engenheiro de Software - Aurea Software

Slide 2

Slide 2 text

Agenda • No principio era o verbo • O que é Big Data? • Estatísticas sobre Big Data • Soluções para Big Data • Oportunidades na Area de Big Data

Slide 3

Slide 3 text

Quién soy jo? • Bacharel em ciência da computação pela UNESP • Desenvolvedor desde 2004, em Java desde 2007 • Evangelista Java, palestrante e entusiasta de tecnologias livres e Open Source. • Coordenador de Eventos do Grupo de Usuários Java. • Engenheiro de Software na Aurea

Slide 4

Slide 4 text

No princípio era o verbo…

Slide 5

Slide 5 text

No content

Slide 6

Slide 6 text

Dados • “Informação” não processada • Fatos • Números • Afirmações • Sem significado • Pode ser texto, video, imagem

Slide 7

Slide 7 text

Informação • Conteúdo útil • Relevante • Possui significado • Processo, estudo, ensaio a partir de dados

Slide 8

Slide 8 text

No content

Slide 9

Slide 9 text

Falemos sobre Big Data

Slide 10

Slide 10 text

Você já deve ter ouvido falar: “Big Data é a solução do seu problema…”

Slide 11

Slide 11 text

No content

Slide 12

Slide 12 text

O MAIOR PROBLEMA DE TI DA ATUALIDADE

Slide 13

Slide 13 text

No content

Slide 14

Slide 14 text

Vamos a lógica

Slide 15

Slide 15 text

Dados, dados, muitos dados • Com o aumento de quantidade de dados • aumenta custos de processamento, logo mais gastos em infraestrutura • armazenamento de dados não é infinito, logo mais gastos com armazenamento e backup • Grande volume de dados aumenta consumo de banda de entrada e saída, ou seja, mais gastos… • tornar a informação disponível requer mais gastos • Orçamento não é infinito e geralmente é bem curto

Slide 16

Slide 16 text

Gastos,

Slide 17

Slide 17 text

gastos…

Slide 18

Slide 18 text

… e mais gastos

Slide 19

Slide 19 text

Resumindo…

Slide 20

Slide 20 text

O que é big data? • Do inglês dado grande (literalmente) • Quando você muitos dados • uma porrada de dados • uma caralhada de dados • ou seja… • DADOS PRA CA!@#$%ˆ&*

Slide 21

Slide 21 text

No content

Slide 22

Slide 22 text

Thiago não pode escrever isso no slide… Então escreve ai:

Slide 23

Slide 23 text

“Big Data é um termo para descrever um problema onde o fluxo de entrada de dados é maior que a capacidade de processa-los”

Slide 24

Slide 24 text

No content

Slide 25

Slide 25 text

Vamos ver algumas estatísticas

Slide 26

Slide 26 text

Boeing 787 produz meio terabyte de dados por vôo Fonte: http://www.computerworlduk.com/news/data/boeing-787s- create-half-terabyte-of-data-per-flight-says-virgin-atlantic-3433595/

Slide 27

Slide 27 text

No content

Slide 28

Slide 28 text

Se há problema e demanda precisa de uma solução

Slide 29

Slide 29 text

Solução para BigData • Armazenamento • Processamento • Análise

Slide 30

Slide 30 text

Solução para BigData • Armazenamento: • HDFS (Hadoop Distributed File System) • Banco de dados não estruturado (não relacional) • MongoDB • Cassandra • Neo4j

Slide 31

Slide 31 text

Solução para BigData • Processamento: • Hadoop MapReduce • Apache Lucene • Solr • Elasticsearch (especialmente pra texto)

Slide 32

Slide 32 text

Solução para BigData • Análise de dados: • Pentaho • Kibana • Graylog

Slide 33

Slide 33 text

Curiosidade: Hadoop, Lucene, Solr, elasticsearch entre outras soluções Big Data

Slide 34

Slide 34 text

No content

Slide 35

Slide 35 text

No content

Slide 36

Slide 36 text

Pra onde eu vou • Engenheiro/Arquiteto de Informação • Cientista de dados • Analista de dados • Designer de BI • Analista de BI • Arquiteto de Cloud • Segurança da Informação

Slide 37

Slide 37 text

No content

Slide 38

Slide 38 text

No content

Slide 39

Slide 39 text

Leituras interessantes • Uma visão universal sobre dados: 
 http://www.emc.com/leadership/digital-universe • Apache Hadoop: http://hadoop.apache.org/ • Apache Lucene: http://lucene.apache.org • Apache Solr: http://lucene.apache.org/solr/ • elasticsearch: https://www.elastic.co/products/elasticsearch • Kibana: https://www.elastic.co/products/kibana • Graylog: https://www.graylog.org/ • Pentaho: http://www.pentaho.com/ • Panorama de Big Data no Brasil: https://www.ibm.com/developerworks/community/blogs/bigdata/ entry/entrevista_com_cezar_taurion_o_estagio_atual_do_big_data_no_brasil • Você realmente sabe o que é Big Data: https://www.ibm.com/developerworks/community/blogs/ ctaurion/entry/voce_realmente_sabe_o_que_e_big_data

Slide 40

Slide 40 text

Projetos do Java Noroeste • Encontros regulares • Incentivo a contribuição da comunidade (Programa de treinamento para futuros palestrantes) (call 4 papers: http://bit.ly/javanoroeste-call-for-papers) • Slack (convite: javanoroeste-slack.herokuapp.com.br) • Novo Logo (votação: bit.ly/pesquisa-logo-javanoroeste) • Novo Site • Banco de currículos • Sistema de gerador de certificado • Entre outros

Slide 41

Slide 41 text

No content

Slide 42

Slide 42 text

Obrigado!!! Thiago Gonzaga Engenheiro de Software - Aurea Software @thiguetta