Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Sistemas de Recomendação
Search
Celso Crivelaro
January 27, 2020
Science
240
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Sistemas de Recomendação
Celso Crivelaro
January 27, 2020
More Decks by Celso Crivelaro
See All by Celso Crivelaro
Big Data para Gerentes de Projetos
celsocrivelaro
0
70
FileSystems em Ruby com FUSE
celsocrivelaro
2
72
Padrões e Boas Práticas de Teste de Tela
celsocrivelaro
0
440
Projeto de APIs
celsocrivelaro
0
170
Testing Network Conditions with ToxiProxy
celsocrivelaro
1
400
Testing Network Conditions with ToxiProxy
celsocrivelaro
0
89
Actor Model in Ruby
celsocrivelaro
0
270
Separando as regras de negócios do Rails
celsocrivelaro
0
190
InfluxDB + Grafana
celsocrivelaro
0
270
Other Decks in Science
See All in Science
機械学習 - ニューラルネットワーク入門
trycycle
PRO
0
1k
Endel Tulvingとエピソード記憶
rmaruy
0
130
データベース05: SQL(2/3) 結合質問
trycycle
PRO
0
1.2k
生成AI・プレプリント時代における 研究成果公開の再設計 ― トップカンファレンス文化はどこへ向かうのか / Redesigning the Dissemination of Research Outputs in the Age of Generative AI and Preprints — Where Is the Top-Conference Culture Heading?
ykiyota
0
17k
How we plan to publish 1,000 bio-logging datasets to GBIF and OBIS
peterdesmet
0
100
防災デジタル分野での官民共創の取り組み (1)防災DX官民共創をどう進めるか
ditccsugii
0
660
データベース01: データベースを使わない世界
trycycle
PRO
1
1.3k
機械学習 - 決定木からはじめる機械学習
trycycle
PRO
0
1.5k
「遂行理論の未来」(松島斉教授最終講義記念セッションの発表資料)
shunyanoda
0
910
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
PRO
0
120
やるべきときにMLをやる AIエージェント開発
fufufukakaka
2
1.4k
データベース04: SQL (1/3) 単純質問 & 集約演算
trycycle
PRO
0
1.5k
Featured
See All Featured
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
380
Joys of Absence: A Defence of Solitary Play
codingconduct
1
390
Color Theory Basics | Prateek | Gurzu
gurzu
0
360
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
22k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
270
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
170
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Speed Design
sergeychernyshev
33
1.8k
Navigating Weather and Climate Data
rabernat
0
210
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
240
Transcript
Sistemas de Recomendação Celso Crivelaro
Software Engineering @ Manager Professor IA e @ Big DaTa
Celso Crivelaro T: @celsocrivelaro E:
[email protected]
O que é um Sistema de Recomendação?
Trazer os tops itens para os Usuários Sistemas de Recomendação
Recomendação <> Busca Diferença: Recomendação é personalizada ao usuário. Busca é para uso geral
https://teses.usp.br/teses/disponiveis/3/3141/tde-26072013-121007/pt-br.php
None
None
None
None
None
Recomendação é um problema de Ranking
Muito provável clicar Menos provável
Muito provável clicar Estou em pânico Menos provável
Técnicas
Filtragem Baseada em Conteúdo
Usa-se os atributos dos itens para comparação Filtragem Baseada em
Conteúdo A recomendação se dá pela proximidade de um item aos itens consumidos pelo usuário Os itens com melhor ranking, aparecem no topo
Preciso definir quais atributos dos itens são relevantes Filtragem Baseada
em Conteúdo Definir pesos e utilidades de cada atributo e instância Os itens com melhor ranking, aparecem no topo
Gênero Atributos Ano de Publicação Palavras-chave
Algoritmo Clássico: IDF - TF
Mesmo usado pela busca (Lucene, engine do ELK, Solr) TF
- IDF Term Frequency - Inverse of Document Frequency Prioriza itens (documentos) com os atributos mais raros
Quando o uso é interessante
Em uma página, mostrar itens similares Usos Em uma base
nova, com poucas interações dos usuários Quando os itens têm atributos mapeáveis
Pontos Fracos
Forte tendência a indicar itens muito parecidos
Filtragem Colaborativa
Princípio: Pessoas parecidas têm gostos próximos Filtragem Colaborativa A recomendação
se dá pela proximidade de um item aos itens consumidos pelo usuário Parecido com o mundo real: Pessoas recomendam no boca-a-boca
Algoritmo Clássico: kNN
Primeiro: Mede-se quanto um usuário é igual aos outros
Segundo: Ao recomendar um item, tira-se a média ponderada pela
similaridade + fator de avaliação (nota)
Quando o uso é interessante
Quando a interação do usuário é fácil de buscar Usos
Aspecto social forte Repetição de padrões de comportamento de usuários
Pontos Fracos
Problema do novo Usuário: Como o usuário não tem itens,
qual recomendar? Pontos Fracos Idem para problema do novo Item Computação cara, precisa de várias heurísticas
Híbridos
Podemos usar as 2 abordagens aos mesmo tempo Sistemas Híbridos
Um pode ser filtro do outro ou dar boost no ranking Podemos usar Regras Conhecidas para filtrar resultados
Decaimento
Problema do Harry Potter
Itens com altíssimo ranking são recomendados sempre Problema do Harry
Potter
O que pode ser decaimento: Tempo, Distância, Volume Usar funções
de Decaimento Decaimento Exponencial
Como se avalia um RecSys?
Top N recomendações. Ideal: N = 5 Avaliação Precisão Recall
Precisão@N Recall@N
Como achamos que Recomendação pode ajudar?
Obrigado!