Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Sistemas de Recomendação
Search
Celso Crivelaro
January 27, 2020
Science
2
210
Sistemas de Recomendação
Celso Crivelaro
January 27, 2020
Tweet
Share
More Decks by Celso Crivelaro
See All by Celso Crivelaro
Big Data para Gerentes de Projetos
celsocrivelaro
0
49
FileSystems em Ruby com FUSE
celsocrivelaro
2
62
Padrões e Boas Práticas de Teste de Tela
celsocrivelaro
0
400
Projeto de APIs
celsocrivelaro
0
150
Testing Network Conditions with ToxiProxy
celsocrivelaro
1
370
Testing Network Conditions with ToxiProxy
celsocrivelaro
0
79
Actor Model in Ruby
celsocrivelaro
0
240
Separando as regras de negócios do Rails
celsocrivelaro
0
180
InfluxDB + Grafana
celsocrivelaro
0
250
Other Decks in Science
See All in Science
Transformers are Universal in Context Learners
gpeyre
0
800
学術講演会中央大学学員会大分支部
tagtag
0
140
07_浮世満理子_アイディア高等学院学院長_一般社団法人全国心理業連合会代表理事_紹介資料.pdf
sip3ristex
0
320
ガウス過程回帰とベイズ最適化
nearme_tech
PRO
1
330
Planted Clique Conjectures are Equivalent
nobushimi
0
150
Visual Analytics for R&D Intelligence @Funding the Commons & DeSci Tokyo 2024
hayataka88
0
160
Collective Predictive Coding Hypothesis and Beyond (@Japanese Association for Philosophy of Science, 26th October 2024)
tanichu
0
110
白金鉱業Meetup Vol.15 DMLによる条件付処置効果の推定_sotaroIZUMI_20240919
brainpadpr
2
780
マルチオミクスデータ解析のためのカーネルテンソル分解による新しい特徴選択法
tagtag
1
100
機械学習 - 授業概要
trycycle
PRO
0
130
01_篠原弘道_SIPガバニングボード座長_ポスコロSIPへの期待.pdf
sip3ristex
0
360
眼科AIコンテスト2024_特別賞_6位Solution
pon0matsu
0
340
Featured
See All Featured
Build The Right Thing And Hit Your Dates
maggiecrowley
35
2.7k
Raft: Consensus for Rubyists
vanstee
137
6.9k
Designing for Performance
lara
608
69k
Into the Great Unknown - MozCon
thekraken
38
1.8k
Fontdeck: Realign not Redesign
paulrobertlloyd
84
5.5k
Visualization
eitanlees
146
16k
How STYLIGHT went responsive
nonsquared
100
5.5k
It's Worth the Effort
3n
184
28k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.2k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Why You Should Never Use an ORM
jnunemaker
PRO
56
9.4k
Transcript
Sistemas de Recomendação Celso Crivelaro
Software Engineering @ Manager Professor IA e @ Big DaTa
Celso Crivelaro T: @celsocrivelaro E:
[email protected]
O que é um Sistema de Recomendação?
Trazer os tops itens para os Usuários Sistemas de Recomendação
Recomendação <> Busca Diferença: Recomendação é personalizada ao usuário. Busca é para uso geral
https://teses.usp.br/teses/disponiveis/3/3141/tde-26072013-121007/pt-br.php
None
None
None
None
None
Recomendação é um problema de Ranking
Muito provável clicar Menos provável
Muito provável clicar Estou em pânico Menos provável
Técnicas
Filtragem Baseada em Conteúdo
Usa-se os atributos dos itens para comparação Filtragem Baseada em
Conteúdo A recomendação se dá pela proximidade de um item aos itens consumidos pelo usuário Os itens com melhor ranking, aparecem no topo
Preciso definir quais atributos dos itens são relevantes Filtragem Baseada
em Conteúdo Definir pesos e utilidades de cada atributo e instância Os itens com melhor ranking, aparecem no topo
Gênero Atributos Ano de Publicação Palavras-chave
Algoritmo Clássico: IDF - TF
Mesmo usado pela busca (Lucene, engine do ELK, Solr) TF
- IDF Term Frequency - Inverse of Document Frequency Prioriza itens (documentos) com os atributos mais raros
Quando o uso é interessante
Em uma página, mostrar itens similares Usos Em uma base
nova, com poucas interações dos usuários Quando os itens têm atributos mapeáveis
Pontos Fracos
Forte tendência a indicar itens muito parecidos
Filtragem Colaborativa
Princípio: Pessoas parecidas têm gostos próximos Filtragem Colaborativa A recomendação
se dá pela proximidade de um item aos itens consumidos pelo usuário Parecido com o mundo real: Pessoas recomendam no boca-a-boca
Algoritmo Clássico: kNN
Primeiro: Mede-se quanto um usuário é igual aos outros
Segundo: Ao recomendar um item, tira-se a média ponderada pela
similaridade + fator de avaliação (nota)
Quando o uso é interessante
Quando a interação do usuário é fácil de buscar Usos
Aspecto social forte Repetição de padrões de comportamento de usuários
Pontos Fracos
Problema do novo Usuário: Como o usuário não tem itens,
qual recomendar? Pontos Fracos Idem para problema do novo Item Computação cara, precisa de várias heurísticas
Híbridos
Podemos usar as 2 abordagens aos mesmo tempo Sistemas Híbridos
Um pode ser filtro do outro ou dar boost no ranking Podemos usar Regras Conhecidas para filtrar resultados
Decaimento
Problema do Harry Potter
Itens com altíssimo ranking são recomendados sempre Problema do Harry
Potter
O que pode ser decaimento: Tempo, Distância, Volume Usar funções
de Decaimento Decaimento Exponencial
Como se avalia um RecSys?
Top N recomendações. Ideal: N = 5 Avaliação Precisão Recall
Precisão@N Recall@N
Como achamos que Recomendação pode ajudar?
Obrigado!