Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Mineração de opinião - Revisão de abordagens e sugestões de uso em ambiente governamental

Mineração de opinião - Revisão de abordagens e sugestões de uso em ambiente governamental

Esta apresentação tem como objetivo mostrar o que é mineração de opinião e quais já foram as abordagem utilizadas. Adicionalmente é apresentado um proposta de abordagem que está sendo estudada pelo autor.

Henrique Varella Ehrenfried

August 15, 2019
Tweet

Other Decks in Science

Transcript

  1. 1 Henrique Varella Ehrenfried - [email protected] Mineração de opinião Revisão

    de abordagens e sugestões de uso em ambiente governamental 16/09/2019 a 18/09/2019 V Seminário sobre Análise de Dados na Administração Pública 2019 Estudante de doutorado do PPGINF da UFPR Eduardo Todt - [email protected] Orientador de doutorado do PPGINF da UFPR
  2. 2 Índice Introdução ao problema Por que minerar opinião? Abordagens

    conhecidas Pesquisa em andamento Considerações finais Dúvidas 1 2 3 4 5 6
  3. 4 Introdução ao problema Posted by: John Smith Date: September

    10, 2011 (1) I bought a Canon G12 camera six months ago. (2) I simply love it. (3) The picture quality is amazing. (4) The battery life is also long. (5) However, my wife thinks it is too heavy for her.” Enviado por : John Smith Dia: 10 de setembro de 2011 (1) Comprei uma câmera Canon G12 seis meses atrás. (2) Eu simplesmente amei. (3) A qualidade de imagem é fantástica. (4) A duração de bateria também é longa. (5) Entretanto, minha esposa acha que ela é muito pesada para ela.” Observações: • A sentença 2 exprime uma opinião positiva sobre a câmera como um todo • A sentença 3 exprime uma opinião positiva sobre a imagem que a câmera produz • A sentença 4 exprime uma opinião positiva sobre a duração de bateria da câmera • A sentença 5 exprime uma opinião negativa sobre o peso da câmera Exemplo extraído do livro: Liu, B. (2012). Sentiment Analysis and Opinion Mining. In G. Hirst (Ed.), Sentiment Analysis and Opinion Mining (Synthesis). Morgan & Claypool.
  4. Introdução ao problema Como pode ser observado pelas sentenças anteriores,

    uma opinião sempre consiste de pelo menos dois componentes: • Uma entidade alvo; • Sentimento sobre esta entidade; Uma entidade é: • Um produto; • Um serviço; • Um tópico; • Uma pessoa; • Uma organização; • Um evento; • Uma publicação; Uma entidade pode conter uma hierarquia de partes e subpartes. Sendo que tanto a entidade quanto suas partes e subpartes possuem um conjunto de atributos (1) Comprei uma câmera Canon G12 seis meses atrás. (2) Eu simplesmente amei. (3) A qualidade de imagem é fantástica. (4) A duração de bateria também é longa. (5) Entretanto, minha esposa acha que ela é muito pesada para ela.” Imagem extraída de: https://www.depaula.com/choosing-the-right-car-parts-for-your- car-and-why-it-matters/
  5. Introdução ao problema Além disso, uma opinião possui mais duas

    características: Há uma fonte, ou seja alguém que emitiu a opinião, e um marcador de tempo de quando a opinião foi emitida, já que uma opinião pode ser modificada ao longo do tempo. Entretanto, nem sempre estes dados são armazenados. (1) Comprei uma câmera Canon G12 seis meses atrás. (2) Eu simplesmente amei. (3) A qualidade de imagem é fantástica. (4) A duração de bateria também é longa. (5) Entretanto, minha esposa acha que ela é muito pesada para ela.” Enviado por : John Smith Dia: 10 de setembro de 2011 Imagem extraída de: https://pixabay.com/illustratio ns/customer-feedback-opinion s-4074440/ Imagem extraída de: https://pixabay.com/phot os/time-clock-alarm-clock- minute-3339479/
  6. 8 Por que minerar opinião? • Popularidade de um evento

    • Pesquisa de Políticas • Comentários para Marketing de Produtos • Identificar bullying • Identificar ironia • Entre outras aplicações
  7. 10 Abordagens conhecidas Imagem extraída de: https://pixabay.com/illustrations/artificial-intellige nce-ai-robot-2228610/ • Bag

    of Words (2002) • Part of Speech (2009) • Word Embedding (2011) • SVM (Support Vector Machine) (2004) • LSTM (Long Short-Term Memory) (2005) • RNN (Recurrent Neural Network) (2005) • Memory Network (2014) • RNTN (Recursive Neural Tensor Network) (2015) Referências no slide seguinte
  8. Abordagens conhecidas 11 Bag of Words: Pang, B., Lee, L.,

    Vaithyanathan, S.: Thumbs up?: sentiment classification using machine learning techniques. In: Proceedings of the ACL-02 conference on Empirical methods in natural language processing-Volume 10, Association for Computational Linguistics (2002) 79–86 Part of Speech: Alec Go, Richa Bhayani, and Lei Huang. Twitter sentiment classification using distant supervision. Technical report, Stanford., 2009 Word Embedding: Ronan Collobert, Jason Weston, Leon Bottou, Michael Karlen, Koray Kavukcuoglu, and Pavel Kuksa. 2011. Natural language processing (almost) from scratch. Journal of Machine Learning Research, 12:2493–2537. SVM (Support Vector Machine): Bo Pang and Lillian Lee. 2004. A sentimental education: sentiment analysis using subjectivity summarization based on minimum cuts. In Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics (ACL '04). Association for Computational Linguistics, Stroudsburg, PA, USA, Article 271 . DOI: https://doi.org/10.3115/1218955.1218990 LSTM (Long Short-Term Memory): Graves A, Schmidhuber J. Framewise phoneme classification with bidirectional LSTM and other neural network architectures. Neural Networks, 2005. RNN (Recurrent Neural Network): Graves A, Schmidhuber J. Framewise phoneme classification with bidirectional LSTM and other neural network architectures. Neural Networks, 2005. Memory Network: WestonJ, Chopra S, Bordes A. Memory networks. arXiv preprint arXiv:1410.3916. 2014. RNTN (Recursive Neural Tensor Network): Qian Q, Tian B, Huang M, Liu Y, Zhu X and Zhu X. Learning tag embeddings and tag-specific composition functions in the recursive neural network. In Proceedings of the Annual Meeting of the Association for Computational Linguistics (ACL 2015), 2015.
  9. 13 Pesquisa em andamento (e,a,s,h,t) e = Entidade a =

    Atributo da entidade s = Sentimento sobre o atributo a h = O emissor da opinião t = Tempo em que a opinião foi emitida Baseado no livro: Liu, B. (2012). Sentiment Analysis and Opinion Mining. In G. Hirst (Ed.), Sentiment Analysis and Opinion Mining (Synthesis). Morgan & Claypool. e = Máquina fotográfica a = [Imagem, Bateria, Massa] s = [Boa, Longa duração, Pesada] h = [John, Esposa do John] t = 10 setembro de 2011
  10. 14 Pesquisa em andamento I think people should collaborate more

    • Identificar as classes gramaticais • Identificar as dependências entre as palavras • Utilizar heurísticas para coletar as informações necessárias para utilizar o modelo proposto por B. Liu • Utilizar algoritmos de aprendizagem de máquina ou algoritmos de SLR (Statistical Relational Learning) para classificar as sentenças
  11. 16 Considerações finais • Mineração de opinião poderá ser utilizado

    no Portal MEC¹ como ferramenta auxiliar para encontrar possíveis conteúdos indevidos, como bullying em comentários. • Outras aplicações práticas incluem seu uso para auxiliar gestores na identificação de sucesso de projetos, a partir de seu uso em relatórios Imagem extraída de: https://pxhere.com/pt/photo/1585019 ¹ https://plataformaintegrada.mec.gov.br/home
  12. 17 Considerações finais • Foi apresentado o campo de estudo

    Opinion Mining • Foram apresentadas as abordagens mais comuns para esse problema • Um proposta de solução foi apresentada Imagem extraída de: https://www.publicdomainpictures.net/e n/view-image.php?image=269478&pictur e=woman-showing-checklist