Slide 1

Slide 1 text

Messias R. Batista | @mrafaelbatista João Pessoa, 10 de Agosto 2021 CONQUISTANDO INTELIGÊNCIA DE NEGÓCIO COM COMPETÊNCIAS ACADÊMICAS MINERAÇÃO DE DADOS:

Slide 2

Slide 2 text

@mrafaelbatista messiasbatista Olá! Gamer amador, Marvel e Google Fã boy Engenheiro e Cientista de Dados Minsait at Indra Company Aluno de Mestrado PPG em Engenharia da Computação, UPE Organizador, GDG João Pessoa Google Developer Group João Pessoa Empreendedor Geek Time Messias R. Batisa Engenheiro e Cientista de Dados Minsait at Indra Company

Slide 3

Slide 3 text

O QUE ESTAMOS FAZENDO AGORA?

Slide 4

Slide 4 text

The Digital Universe: 50-fold Growth from the Beginning of 2010 do the End of 2020 130 2005 IDC's Digital Universe Study, sponsored by EMC, December 2012 40.000 2020

Slide 5

Slide 5 text

175 zetabytes até 2025 Tom Coughlin Forbes Dezembro, 2018 "O crescimento desses dados será resultado da incorporação de agentes inteligentes que utilizam o aprendizado de máquina e outras formas de inteligência artificial para analisar a quantidade crescente de dados gerados pelas coisas digitais em nossas vidas."

Slide 6

Slide 6 text

Unidade de Medida http://graduacion-estadistica.blogspot.com/2019/02/big-data- na-vida-de-megabytes-zetabytes.html Fevereiro, 2019

Slide 7

Slide 7 text

O QUE FAZER COM ESSES DADOS?

Slide 8

Slide 8 text

Dados, muitos dados "Mais de 59 zetabytes (ZB) de dados serão criados, capturados, copiados e consumidos no mundo este ano, de acordo com uma nova atualização do Global DataSphere da International Data Corporation ( IDC )" Internacional Data Corporacion IDC's Global DataSphere Forecast Shows Continued Steady Growth in the Creation and Consumption of Data 8 May 2020.

Slide 9

Slide 9 text

AS ORGANIZAÇÕES ESTÃO ATENTAS A ESTES DADOS?

Slide 10

Slide 10 text

No content

Slide 11

Slide 11 text

Qual profissional poderia auxiliar a organização?

Slide 12

Slide 12 text

No content

Slide 13

Slide 13 text

Vamos chegar lá! Mina de dados Minerador Ferramentas

Slide 14

Slide 14 text

"[...] o termo foi cunhado com alusão ao processo de mineração [...], uma vez que se explora uma base de dados (mina) usando algoritmos (ferramentas) adequados para obter conhecimento (minerais preciosos). Mineração de Dados De Castro (2016)

Slide 15

Slide 15 text

Mineração de Dados Descoberta de conhecimento em bases de dados (KDD, Knowledge discovery in databases)

Slide 16

Slide 16 text

KDD BASE DE DADOS: Coleção organizada de dados. PREPARAÇÃO OU PRÉ-PROCESSAMENTO DE DADOS: Etapas anteriores à mineração de dados. Objetiva preparar os dados para a análise. MINERAÇÃO DE DADOS: Etapa responsável por aplicar algoritmos capazes de extrair conhecimento. AVALIAÇÃO OU VALIDAÇÃO: Busca-se analisar os resultados com objetivo de identificar se o conhecimento gerado é útil e não trivial.

Slide 17

Slide 17 text

Multidisciplinaridade da mineração de dados De Castro (2016)

Slide 18

Slide 18 text

ANÁLISE DESCRITIVA DE DADOS Medir, explorar e descrever características intrínsecas aos dados. PREDIÇÃO: CLASSIFICAÇÃO E ESTIMAÇÃO Classificação de um objeto desconhecido. Regressão ou estimação. ANÁLISE DE GRUPOS Clustering busca encontrar semelhanças entre os objetos e agrupá-los de acordo com tais parâmetros. ASSOCIAÇÃO: Busca-se encontrar associação entre objetos ou atributos. DETECÇÃO DE ANOMALIAS: Busca-se encontrar valores discrepantes.

Slide 19

Slide 19 text

Metodologia CRISP-DM Cross Industry Standard Process for Data Mining Processo Padrão da Indústria Cruzada para Mineração de Dados

Slide 20

Slide 20 text

Ciência de Dados Grus (2016) "Ciência de dados é a profissão que busca extrair informação de dados desorganizados."

Slide 21

Slide 21 text

No content

Slide 22

Slide 22 text

https://www.marketsandmarkets.com/Market-Reports/data-science-platform-market-21532997.html Mercado

Slide 23

Slide 23 text

Novas Carreiras Chief Information Officers Data Scientists Data Architecture Data Engineer Machine Learning Engineer

Slide 24

Slide 24 text

PARA QUE PRECISAMOS DE NOVAS CARREIRAS?

Slide 25

Slide 25 text

No content

Slide 26

Slide 26 text

No content

Slide 27

Slide 27 text

Udacity

Slide 28

Slide 28 text

No content

Slide 29

Slide 29 text

Papel do Ciêntista de Dados Projetos de Ciência de Dados São responsáveis pelos projetos de ciência de dados em vários níveis Desenvolver Habilidades Matemática e Estatísica, Programação, Domínio Diversidade de Fontes de Dados Ser capaz de estudar as diversas fontes de dados disponíveis na organização. Formato de Dados Capacidade de extrair dados de diversos formatos. Algoritmos Analisar e projetar modelos e algoritmos. Visualização Realizar inferências e apresentar os resultados.

Slide 30

Slide 30 text

Reflexão Observação Delimitação do problema Levantamento de hipóteses Experimentos Análise de resultados Conclusão / Apresentação

Slide 31

Slide 31 text

Paper Análise do Consumo de Combustível da PM-PE com Foco no Controle Interno

Slide 32

Slide 32 text

COMO SE TORNAR UM DATA SCIENTIST?

Slide 33

Slide 33 text

NÃO É POSSÍVEL SE TORNAR CIENTISTA DE DADOS EM UMA SEMANA

Slide 34

Slide 34 text

Aprendendo Ciência de Dados Part 1: Faça uma auto-avaliação Part 2: Prepare seu computador Part 3: Aprenda um pouco de estatística Part 4: Bancos de Dados, Big Data e NoSQL Part 5: Linguagem de Programação (Python / R) Part 6: Machine Learning Part 7: Desenvolva conhecimento do negócio Part 8: Apresentação e Visualização dos Dados

Slide 35

Slide 35 text

Ferramentas

Slide 36

Slide 36 text

Data Science Lifecycle

Slide 37

Slide 37 text

Sugestões de Leitura

Slide 38

Slide 38 text

Sugestões de Leitura

Slide 39

Slide 39 text

Referências DE CASTRO, Leandro Nunes. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo - Ed. Saraiva, 2016. GRUS, Joel. Data Science do Zero. Traduzido por Welington Nascimento. - Rio de Janeiro : Alta Books, 2016.

Slide 40

Slide 40 text

Obrigado! Messias Batisa @mrafaelbatista messiasbatista João Pessoa, 10 de Agosto 2021 CONQUISTANDO INTELIGÊNCIA DE NEGÓCIO COM COMPETÊNCIAS ACADÊMICAS MINERAÇÃO DE DADOS: Engenheiro e Cientista de Dados Minsait at Indra Company

Slide 41

Slide 41 text

Messias R. Batista | @mrafaelbatista João Pessoa, 10 de Agosto 2021 CONQUISTANDO INTELIGÊNCIA DE NEGÓCIO COM COMPETÊNCIAS ACADÊMICAS MINERAÇÃO DE DADOS: