Sistemas de Recomendação

Sistemas de Recomendação Celso Crivelaro

Software Engineering @ Manager Professor IA e @ Big DaTa
Celso Crivelaro T: @celsocrivelaro E: [email protected]

O que é um Sistema de Recomendação?

Trazer os tops itens para os Usuários Sistemas de Recomendação
Recomendação <> Busca Diferença: Recomendação é personalizada ao usuário. Busca é para uso geral

https://teses.usp.br/teses/disponiveis/3/3141/tde-26072013-121007/pt-br.php

Recomendação é um problema de Ranking

Muito provável clicar Menos provável

Muito provável clicar Estou em pânico Menos provável

Técnicas

Filtragem Baseada em Conteúdo

Usa-se os atributos dos itens para comparação Filtragem Baseada em
Conteúdo A recomendação se dá pela proximidade de um item aos itens consumidos pelo usuário Os itens com melhor ranking, aparecem no topo

Preciso definir quais atributos dos itens são relevantes Filtragem Baseada
em Conteúdo Definir pesos e utilidades de cada atributo e instância Os itens com melhor ranking, aparecem no topo

Gênero Atributos Ano de Publicação Palavras-chave

Algoritmo Clássico: IDF - TF

Mesmo usado pela busca (Lucene, engine do ELK, Solr) TF
- IDF Term Frequency - Inverse of Document Frequency Prioriza itens (documentos) com os atributos mais raros

Quando o uso é interessante

Em uma página, mostrar itens similares Usos Em uma base
nova, com poucas interações dos usuários Quando os itens têm atributos mapeáveis

Pontos Fracos

Forte tendência a indicar itens muito parecidos

Filtragem Colaborativa

Princípio: Pessoas parecidas têm gostos próximos Filtragem Colaborativa A recomendação
se dá pela proximidade de um item aos itens consumidos pelo usuário Parecido com o mundo real: Pessoas recomendam no boca-a-boca

Algoritmo Clássico: kNN

Primeiro: Mede-se quanto um usuário é igual aos outros

Segundo: Ao recomendar um item, tira-se a média ponderada pela
similaridade + fator de avaliação (nota)

Quando o uso é interessante

Quando a interação do usuário é fácil de buscar Usos
Aspecto social forte Repetição de padrões de comportamento de usuários

Pontos Fracos

Problema do novo Usuário: Como o usuário não tem itens,
qual recomendar? Pontos Fracos Idem para problema do novo Item Computação cara, precisa de várias heurísticas

Híbridos

Podemos usar as 2 abordagens aos mesmo tempo Sistemas Híbridos
Um pode ser filtro do outro ou dar boost no ranking Podemos usar Regras Conhecidas para filtrar resultados

Decaimento

Problema do Harry Potter

Itens com altíssimo ranking são recomendados sempre Problema do Harry
Potter

O que pode ser decaimento: Tempo, Distância, Volume Usar funções
de Decaimento Decaimento Exponencial

Como se avalia um RecSys?

Top N recomendações. Ideal: N = 5 Avaliação Precisão Recall

Precisão@N Recall@N

Como achamos que Recomendação pode ajudar?

Obrigado!

Sistemas de Recomendação

Sistemas de Recomendação

More Decks by Celso Crivelaro

Other Decks in Science

Featured

Transcript