Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Expandindo suas habilidades de big data batch p...

Expandindo suas habilidades de big data batch processing para streaming e multi-cloud

Apresentação realizada por Marcos Takeshi no Big Data Week São Paulo 2019 [http://sao-paulo.bigdataweek.com].

Big Data Week São Paulo

November 02, 2019
Tweet

More Decks by Big Data Week São Paulo

Other Decks in Technology

Transcript

  1. AGENDA • Sobre mim • Tendências • Atualização • Tema?

    • Arquitetura • Crawling • Infra • Controller • Cloud • Validação BIG DATA WEEK SÃO PAULO 2019
  2. Big Data Master Specialist MARCOS TAKESHI técnico eletrotécnico engenheiro eletrônico

    (telecomunicações) administração empresas big data ISTJ /marcos.takeshi /takeshi_marcos /marcostakeshi http://sao-paulo.bigdataweek.com/ BIG DATA WEEK SÃO PAULO 2019
  3. ISTJ Acrônimo utilizado para descrever as personalidades criadas por Katharine

    Briggs e Isabel Myers Significados: "Introverted", "Sensing", "Thinking", "Judging". ISTJ indica uma pessoa que valoriza o tempo gasto consigo mesmo (Introverted), que foca mais em fatos e detalhes do que ideias e conceitos (Sensing), que faz decisões baseada na lógica e na razão (Thinking) e que prefere se planejada e organizada a ser espontânea e flexível (Judging). BIG DATA WEEK SÃO PAULO 2019
  4. MASTER ESPECIALIST - Perfil Técnico - Referência Técnica - Compartilha

    conhecimento - Atua em diversos papéis - Mobilidade entre projetos - Estagiários BIG DATA WEEK SÃO PAULO 2019 analistas coordenadores especialistas gerentes especialistas master
  5. EVENTOS & TENDÊNCIAS - Strata 2018 (Março): Spark - Strata

    2018 (Setembro): Machine Learning - Strata 2019 (Março): Streaming - Strata 2019 (Setembro): Inteligência Artificial BIG DATA WEEK SÃO PAULO 2019
  6. GUIDELINES - Hadoop e processamento Batch são commodities - Itens

    inclusos no hadoop devem ser de conhecimento dos profissionais - hdfs - sqoop - flume - hive - impala - hbase BIG DATA WEEK SÃO PAULO 2019
  7. LINUX - o ecossistema hadoop é opensource e roda em

    linux - nem sempre interfaces gráficas estão disponíveis - conhecimento de comandos linux economiza programação BIG DATA WEEK SÃO PAULO 2019
  8. PROCESSAMENTO - Spark (Python/ Scala) ainda é bastante utilizado em

    processamento batch - Storm - Flink BIG DATA WEEK SÃO PAULO 2019
  9. OUTRAS FERRAMENTAS - Solr - Elasticsearch/ Kibana/ Logstash/ Beat/ plugins/

    ML - WSO2 Stream Processor - Apache Nifi - Streamsets BIG DATA WEEK SÃO PAULO 2019
  10. FRAMEWORKS ML - pandas - scikit-learn - tensorflow - theano

    - keras - H2O BIG DATA WEEK SÃO PAULO 2019
  11. PROJETOS PESSOAIS - Projetos simples (crawlers, APIs, etc) - Game

    Hacking - Arduino & RaspberryPI - Alexa / Dash Button BIG DATA WEEK SÃO PAULO 2019
  12. PROJETOS FUTUROS - Robô para aumentar seguidores (Instagram) - Chatbot

    com Telegram - Garduino - etc... BIG DATA WEEK SÃO PAULO 2019
  13. OBJETIVO BIG DATA WEEK SÃO PAULO 2019 coisas que você

    AMA coisas em que você é BOM coisas que dão DINHEIRO
  14. IKIGAI BIG DATA WEEK SÃO PAULO 2019 DINHEIRO MUNDO BOM

    AMA PAIXÃO MISSÃO VOCAÇÃO PROFISSÃO satisfação, mas sentimento de inutilidade confortável, mas sentimento de vazio entusiasmo, mas sentimento de incerteza alegria, mas sem prosperidade RAZÃO DE VIVER
  15. INTENÇÃO BIG DATA WEEK SÃO PAULO 2019 - Profissionais não

    se limitem apenas a suas funções - Expandam seus conhecimentos
  16. ENGAJAMENTO - Pró-Atividade - Objetivo em mente - Primeiro o

    mais importante - Ganha-ganha - Primeiro compreender, depois ser compreendido - Crie sinergia - Cuide da máquina BIG DATA WEEK SÃO PAULO 2019
  17. - POC trading: Operação em mini-índices PROJETO PESSOAL ATUAL -

    desenvolvimento de projetos paralelos que estimulem BIG DATA WEEK SÃO PAULO 2019
  18. OBJETO DE ESTUDO BIG DATA WEEK SÃO PAULO 2019 Contratos

    futuros são acordos de compra e venda de produtos negociados na Bolsa de Valores com uma data de vencimento futura. Os minicontratos são uma oportunidade para que investidores com pequeno capital possam operar no mercado futuro, acreditando na alta ou baixa de produtos como Índices, Moedas ou Juros. Os principais investimentos que podem ser feitos com minicontratos são: - Dólar (WDO) - Índices (WIN)
  19. Arquitetura da POC BIG DATA WEEK SÃO PAULO 2019 EC2

    crawler rest web service kafka zookeeper S3 Google Drive site controle captura controle análise
  20. SELENIUM - Desenvolvimento em Python - Selenium migração de docker

    para EC2 pesquisa docker hub BIG DATA WEEK SÃO PAULO 2019
  21. Cloud Conhecimentos adicionais para gerenciamento de instâncias AWS (DevOps) "tão

    importante quanto ganhar é controlar quanto gasta" BIG DATA WEEK SÃO PAULO 2019
  22. Lambda – Códigos Python BIG DATA WEEK SÃO PAULO 2019

    import boto3 def lambda_handler(event, context): ec2 = boto3.client('ec2', 'us-east-1') ec2.start_instance('i-0201d38dfd205x1fb') import boto3 def lambda_handler(event, context): ec2 = boto3.client('ec2', 'us-east-1') ec2.stop_instance('i-0201d38dfd205x1fb')
  23. KAFKA CONSUMER BIG DATA WEEK SÃO PAULO 2019 - Programa

    em python ou scala utilizando spark streaming - Utilizando função windowing para análise de diversos tempos gráficos - Gravação dos resultados em novos tópicos separados por tempo gráfico
  24. OPERAÇÕES BIG DATA WEEK SÃO PAULO 2019 - window -

    countByWindow - reduceByWindow - reduceByKeyAndWindow - countByValueAndWindow