Upgrade to Pro — share decks privately, control downloads, hide ads and more …

TCC - Classificação Automática de Opiniões

TCC - Classificação Automática de Opiniões

Desenvolvimento de um Protótipo de Classificação Automática de Opiniões

Paulo Henrique

March 04, 2016
Tweet

More Decks by Paulo Henrique

Other Decks in Technology

Transcript

  1. Desenvolvimento de um Protótipo de Classificação Automática de Opiniões Paulo

    Henrique de Sousa Orientador: Fernando Luiz de Oliveira
  2. Introdução • Mineração de dados; • Descoberta de padrões e

    tendências; • Provimento de vantagem competitiva.
  3. Classificação de Opiniões • Analise de Mídias Sociais; • Automatização

    da classificação.
  4. Processo KDD

  5. KDD e KDT

  6. Text Mining - Pré-processamento • Tokenização; • Limpeza – (Remoção

    de Stopwords); • Stemming.
  7. Tarefas de Text Mining • Sumarização; • Classificação; • Clusterização;

    • Associação.
  8. Metodologia • Referencial bibliográfico; • Estudo da Weka API (algoritmo

    SVM e KNN); • Base de Opiniões (APIs Facebook, Twitter e Google Plus); • Desenvolvimento do Protótipo; • Testes.
  9. Protótipo de Classificação Automática • Classificador de opiniões obtidas em

    tempo real. – O resultado pode apoiar os gestores da empresa; • Classifica as opiniões em 5 categorias. – Positivas – Muito positivas – Negativas – Muito negativas – Neutras
  10. Base de Conteúdo • Facebook Graph API - Search •

    Twitter API 1.1 - Search • Google Activities - Search
  11. Arquitetura do Protótipo • Biblioteca de mineração – (Classe principal)

    ClassifierOptions – TextDataBase – TextReader – WordProcessor
  12. Arquitetura do Protótipo

  13. Fluxo do projeto

  14. None
  15. Considerações Finais • Para facilitar a análise das opiniões disponíveis

    na web é importante a utilização de ferramentas adequadas, tal como a apresentada neste trabalho; • O trabalho foi muito importante por possibilitar o estudo de uma área promissora que é a mineração de dados e suas subáreas ; • A utilização de palavras pré-classificadas com até 6 valores semânticos permite uma análise mais abrangente; • Em um trabalho futuro podem ser utilizadas as APIs de streaming das redes sociais utilizadas.
  16. Desenvolvimento de um Protótipo de Classificação Automática de Opiniões Paulo

    Henrique de Sousa