Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Sistemas de Recomendação
Search
Celso Crivelaro
January 27, 2020
Science
2
230
Sistemas de Recomendação
Celso Crivelaro
January 27, 2020
Tweet
Share
More Decks by Celso Crivelaro
See All by Celso Crivelaro
Big Data para Gerentes de Projetos
celsocrivelaro
0
66
FileSystems em Ruby com FUSE
celsocrivelaro
2
72
Padrões e Boas Práticas de Teste de Tela
celsocrivelaro
0
430
Projeto de APIs
celsocrivelaro
0
160
Testing Network Conditions with ToxiProxy
celsocrivelaro
1
390
Testing Network Conditions with ToxiProxy
celsocrivelaro
0
83
Actor Model in Ruby
celsocrivelaro
0
260
Separando as regras de negócios do Rails
celsocrivelaro
0
180
InfluxDB + Grafana
celsocrivelaro
0
260
Other Decks in Science
See All in Science
Distributional Regression
tackyas
0
340
AIによる科学の加速: 各領域での革新と共創の未来
masayamoriofficial
0
410
HDC tutorial
michielstock
1
390
俺たちは本当に分かり合えるのか? ~ PdMとスクラムチームの “ずれ” を科学する
bonotake
2
1.7k
主成分分析に基づく教師なし特徴抽出法を用いたコラーゲン-グリコサミノグリカンメッシュの遺伝子発現への影響
tagtag
PRO
0
180
データから見る勝敗の法則 / The principle of victory discovered by science (open lecture in NSSU)
konakalab
1
270
防災デジタル分野での官民共創の取り組み (1)防災DX官民共創をどう進めるか
ditccsugii
0
510
PPIのみを用いたAIによる薬剤–遺伝子–疾患 相互作用の同定
tagtag
PRO
0
160
学術講演会中央大学学員会府中支部
tagtag
PRO
0
350
機械学習 - ニューラルネットワーク入門
trycycle
PRO
0
940
サイコロで理解する原子核崩壊と拡散現象 〜単純化されたモデルで本質を理解する〜
syotasasaki593876
0
150
Rashomon at the Sound: Reconstructing all possible paleoearthquake histories in the Puget Lowland through topological search
cossatot
0
510
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
240
KATA
mclloyd
PRO
34
15k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
130
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
290
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
650
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
67
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
69
The Curse of the Amulet
leimatthew05
1
8.7k
Transcript
Sistemas de Recomendação Celso Crivelaro
Software Engineering @ Manager Professor IA e @ Big DaTa
Celso Crivelaro T: @celsocrivelaro E:
[email protected]
O que é um Sistema de Recomendação?
Trazer os tops itens para os Usuários Sistemas de Recomendação
Recomendação <> Busca Diferença: Recomendação é personalizada ao usuário. Busca é para uso geral
https://teses.usp.br/teses/disponiveis/3/3141/tde-26072013-121007/pt-br.php
None
None
None
None
None
Recomendação é um problema de Ranking
Muito provável clicar Menos provável
Muito provável clicar Estou em pânico Menos provável
Técnicas
Filtragem Baseada em Conteúdo
Usa-se os atributos dos itens para comparação Filtragem Baseada em
Conteúdo A recomendação se dá pela proximidade de um item aos itens consumidos pelo usuário Os itens com melhor ranking, aparecem no topo
Preciso definir quais atributos dos itens são relevantes Filtragem Baseada
em Conteúdo Definir pesos e utilidades de cada atributo e instância Os itens com melhor ranking, aparecem no topo
Gênero Atributos Ano de Publicação Palavras-chave
Algoritmo Clássico: IDF - TF
Mesmo usado pela busca (Lucene, engine do ELK, Solr) TF
- IDF Term Frequency - Inverse of Document Frequency Prioriza itens (documentos) com os atributos mais raros
Quando o uso é interessante
Em uma página, mostrar itens similares Usos Em uma base
nova, com poucas interações dos usuários Quando os itens têm atributos mapeáveis
Pontos Fracos
Forte tendência a indicar itens muito parecidos
Filtragem Colaborativa
Princípio: Pessoas parecidas têm gostos próximos Filtragem Colaborativa A recomendação
se dá pela proximidade de um item aos itens consumidos pelo usuário Parecido com o mundo real: Pessoas recomendam no boca-a-boca
Algoritmo Clássico: kNN
Primeiro: Mede-se quanto um usuário é igual aos outros
Segundo: Ao recomendar um item, tira-se a média ponderada pela
similaridade + fator de avaliação (nota)
Quando o uso é interessante
Quando a interação do usuário é fácil de buscar Usos
Aspecto social forte Repetição de padrões de comportamento de usuários
Pontos Fracos
Problema do novo Usuário: Como o usuário não tem itens,
qual recomendar? Pontos Fracos Idem para problema do novo Item Computação cara, precisa de várias heurísticas
Híbridos
Podemos usar as 2 abordagens aos mesmo tempo Sistemas Híbridos
Um pode ser filtro do outro ou dar boost no ranking Podemos usar Regras Conhecidas para filtrar resultados
Decaimento
Problema do Harry Potter
Itens com altíssimo ranking são recomendados sempre Problema do Harry
Potter
O que pode ser decaimento: Tempo, Distância, Volume Usar funções
de Decaimento Decaimento Exponencial
Como se avalia um RecSys?
Top N recomendações. Ideal: N = 5 Avaliação Precisão Recall
Precisão@N Recall@N
Como achamos que Recomendação pode ajudar?
Obrigado!