Using Taxonomies for Product Recommendation

Using Taxonomies for Product Recommendation Osvaldo Matos-Junior1, Nivio Ziviani1, Fabiano
Botelho1, Anísio Lacerda1, Altigran Silva2 and Marco Cristo2 1- Universidade Federal de Minas Gerais (UFMG) 2- Universidade Federal do Amazonas (UFAM)

Roteiro Sistemas de Recomendação Uso de Taxonomias na Recomendação de
Produtos Resultados

Sistemas de Recomendação

Surprise!! Sugere aos usuário novos itens de interesse: produtos, textos
para leitura, música, ﬁlmes, amigos, etc.

Baseada em Conteúdo Filtragem Colaborativa Demográﬁca Personalizada Baseado na Comunidade
Sistemas Híbridos Técnicas de Recomendação

Uso de Taxonomias na Recomendação de Produtos

Recomendação Baseada em Conteúdo

Representação Vetorial d = {w1, w2, w3, ..., wn} d
= representação do documento (livro ou notícia) w = peso do termo no documento (TF-IDF) notícia = título + corpo do texto livro = título + autores + sinopse

Abordagem simplista - baseline Ranking com livros mais similares. -
Livros do topo correspondem à lista de recomendação Similaridade Vetorial

? Recomendação

Problemas!! 1. Semântico 2. Contexto

Vocabulário Insuﬁciente Pousadas com desconto na América do Latina Descontos
nos Estados Unidos da América A América para os latinos depois de Bush Catálogo de Hotéis no Brasil Conheça o México

Contexto do Usuário Final da Liga: Barcelona vs Real Madrid
Guia de baladas de Barcelona Os maiores pintores de Madrid Real Madrid, o time do século Puyol - a história do ídolo do Barcelona vs

Salvação: taxonomias (base externa de conhecimento)

Taxonomia dos seres vivos

Taxonomia de Livros

Estratégias 1. Descritores de Categoria 2. Filtro de Categorias 3.
Características de Classiﬁcação

Informação de Taxonomia

Descritores de Categoria Termos que se destacam nas categorias. Kullback-Leibler
divergence (KLD) Pearson's Chi-Squared (CHI2) Dice's coefﬁcient (DICE) Document Frequency (DF) Combined Measures: (ALL)

Descritores para Religião

Descritores de Categoria Combinação dos descritores: Obs.: contribui para revocação.

Descritores de Categoria

Filtro de Categorias ? new old

Gabrilovich (2005) e Anagnostopoulos (2007) - combinar um novo espaço
de características sim = palavras + novas características base de conhecimento = taxonomia conceitos = categorias Características de Classiﬁcação

Características de Classiﬁcação dcat = {c1, c2, c3, ..., cn}
vetor de palavras novas características dcat = nova representação do documento c = categoria na taxonomia de livros

Resultados

Métodos de Recomendação

Humana vs Automático (Cenários de Classiﬁcação)

Se você estivesse acessando esta página Web, quais livros você
consideraria uma boa recomendação?

Bases de Dados 100 notícias 1,5 milhão de livros

Julgamento Incompleto 1 0 0.2 0.4 0.6 0.8 1 0
0.2 0.4 0.6 0.8 actual map inferred map 1 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 actual map bpref-10 bpref x infAP (Yilmas & Aslam, 2006)

1 0 0.2 0.4 0.6 0.8 0.9 0.4 0.5 0.6
0.7 0.8 Revocação Precisão CLF-EC CLF-SE BOW 1 0 0.2 0.4 0.6 0.8 0.9 0.5 0.6 0.7 0.8 Revocação Precisão BOW CTF-1A CTF-5A CTF-10A CTF-M

Ganhos em infAP Descritores de Categoria: - manual: 13,5% -
automático: 7,5% Filtro de Categorias: - manual: 13,5% - automático: 7,5% Características de Classiﬁcação: - automático: 10,4%

Melhores Métodos e Combinação de Estratégias

1 0 0.25 0.5 0.75 1 0 0.25 0.5 0.75
BOW HYBRID-M Q1 Q2 Q3 Q4 Impacto da Taxonomia

Concluindo...

... taxonomia melhora a recomendação de produtos! p@k: 16% a
28% pavg@k: 15% a 20%

Osvaldo Matos-Junior [email protected] Q&A

Referências Gabrilovich, E. & Markovitch, S. (2005). Feature generation for
text categorization using world knowledge. In Proceedings of the 19th International Joint Conference on Artiﬁcial Intelligence, volume 19, pp. 1048– 1053. Anagnostopoulos, A.; Broder, A. Z.; Gabrilovich, E.; Josifovski, V. & Riedel, L. (2007). Just-in-time Contextual Advertising. In Proceedings of the Sixteenth ACM Confe- rence on Information and Knowledge Management, pp. 331–340. Carpineto, C. & Romano, G. (1999). Towards more effective techniques for automatic query expansion. Proceedings of the Third European Conference on Research and Advanced Technology for Digital Libraries, pp. 126–141. Yilmaz, E. & Aslam, J. (2006). Estimating average precision with incomplete and imperfect judgments. In Proceedings of the 15th ACM International Conference on Information and Knowledge Management, pp. 102–111.

Using Taxonomies for Product Recommendation

Using Taxonomies for Product Recommendation

More Decks by Osvaldo Matos Júnior

Other Decks in Research

Featured

Transcript