Uma introdução prática ao aprendizado de máquina com o Weka

Uma introdução prática ao aprendizado de máquina com o Weka

712a8a8a2ac5145874ab33c328a17f05?s=128

Lucas Santos

January 27, 2018
Tweet

Transcript

  1. Uma introdução prática ao aprendizado de máquina com o Weka

  2. Parte I: introdução

  3. • Lucas Santos • Desenvolvedor há 3 anos • Experiência

    em desenvolvimento web com Ruby, Java e Angular • Pesquisa em inteligência artificial
  4. Projetos • Pedophiles Analysis System • Processamento e análise de

    textos
  5. Parte II: teoria

  6. Aprendizagem de Máquina É uma área da IA cujo objetivo

    é a construção de técnicas computacionais, visando o aprendizado de forma automática.
  7. Terminologia • Inteligência Artificial • Área da computação cujo objetivo

    é estudar e desenvolver sistemas que simulem a capacidade humana de resolver problemas • Aprendizagem de Máquina • Visa o desenvolvimento de algoritmos que são “treinados”, baseando-se em modelos matemáticos • Data mining • Extração de conhecimento de bases de dados, usando técnicas de aprendizagem de máquina
  8. Métodos de aprendizagem de máquina

  9. Métodos preditivos Usa modelos estatísticos e técnicas de predição para

    entender o futuro e responder: “O que poderia acontecer?”
  10. Classificação • Marketing direcionado • Filtros de Spams • Risco

    de crédito • Separação de notícias • Previsão de doenças
  11. Regressão É encontrar a melhor equação que determina o valor

    de y, baseando-se em um conjunto de variáveis x
  12. • Atributos de um imóvel -> valor de venda; •

    Gastos com o cartão de crédito -> limite. Regressão
  13. Métodos descritivos Usa uma agregação e mineração de dados para

    prover insights sobre o passado e responder: “O que aconteceu?”
  14. Associação Define regras de associação, ou seja, define com que

    frequência dois ou mais eventos ocorrem juntos
  15. Associação

  16. Agrupamento É uma técnica que visa agrupar objetos semelhantes entre

    si, de tal forma que forme grupos segmentados de acordo com as características encontradas.
  17. • Segmentação de Mercado • Marketing direcionado • Mala direta

    • Perfil de clientes Agrupamento
  18. Detecção de desvios Técnica que tenta identificar objetos ou eventos

    que não estão de acordo com um padrão determinado.
  19. Detecção de desvios • Fraudes em cartões de crédito •

    Motores em automóveis • Fábricas automatizadas
  20. Padrões sequenciais Técnica que tenta identificar a ordem em que

    objetos ou tarefas são executados.
  21. Padrões sequenciais • Sugestões de produtos • Marketing direcionado •

    Sugetões de sites
  22. Sumarização Técnica que tenta extrair as principais informações em um

    conjunto de dados
  23. Sumarização • “Estão presentes nessa sala pessoas com idade entre

    18 e 35 anos, que estudam tecnologia da informação” • Perfis de clientes
  24. Tipos de aprendizagem de máquina

  25. Aprendizagem supervisionada Extração de características Algoritmo de aprendizagem Modelo aprendido

    Supervisor Extração de características Modelo aprendido Bart Simpson Exemplo de Jones Granatyr
  26. Aprendizagem não-supervisionada A análise ocorre de forma automática, sem a

    interferência de um supervisor. Os algoritmos são responsáveis por determinar a relação entre os dados observados.
  27. Aprendizagem por reforço • A aprendizagem ocorre por meio das

    interações com o ambiente. • Aprendizagem ocorre por experiência própria
  28. WEKA

  29. WEKA • Biblioteca de mineração de dados e aprendizagem de

    máquina escrita em Java • Desenvolvido pelo grupo de Machine Learning da Universidade de Waikato, Nova Zelândia • Open source
  30. WEKA • Utiliza arquivos no formato ARFF para obter dados

    • Permite conexão direta com bases de dados via JDBC
  31. Parte III: na prática

  32. Naïve Bayes • É uma abordagem probabilística • Indica a

    probabilidade de um dado analisado pertencer a alguma classe pré-definida
  33. None
  34. • Tendo uma base de dados histórica, o algoritmo gerará

    uma tabela de probabilidades Naïve Bayes
  35. None
  36. Naïve Bayes • Para se obter a classificação de um

    exemplo ainda não analisado, os atributos informados devem ser submetidos a tabela de probabilidades.
  37. None
  38. Redes Neurais Artificiais

  39. Redes Neurais Artificiais • São usadas para solucionar problemas complexos,

    onde não há um modelo matemático pré-definido. • Demandam um tempo de aprendizagem maior.
  40. Redes Neurais Artificiais • Neurônios: o cérebro usa para processar

    as informações • Axônio: transmite um sinal de um neurônio para outro (sinapses) e conecta os neurônios • Substâncias químicas são lançadas das sinapses e entram pelos dendritos, aumentando ou baixando o potêncial elétrico do corpo da célula. • O neurônio dispara se a entrada é maior que um número definido.
  41. Redes Neurais Artificiais 1943 - McCulloch e Pitts 1958 –

    Frank Rosenblatt (perceptron)
  42. Redes Neurais Artificiais • Pesos são as sinapses •Pesos positivos:

    sinapses excitadoras •Pesos negativos: sinapses inibidoras •A aprendizagem é dada pelos valores dos pesos
  43. Redes Neurais Artificiais

  44. Redes Neurais Artificiais • Para calcular os pesos, algumas formas

    simples são as seguintes equações: peso(n+1) = peson(n) + (taxaAprendizagem * entrada * error) erro = respostaCorreta - respostaCalculada
  45. Redes Neurais Artificiais

  46. Redes Neurais Artificiais

  47. Parte IV: próximos passos

  48. Onde aprender Machine Learning? • Deep Learning Specialization (Coursera) •

    Machine Learning e Data Science com Java e Weka (Udemy) • Machine Learning e Data Science com Python (Udemy) • Machine Learning e Data Science com R (Udemy)
  49. Dúvidas?