Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Sistemas de Recomendação
Search
Celso Crivelaro
January 27, 2020
Science
2
210
Sistemas de Recomendação
Celso Crivelaro
January 27, 2020
Tweet
Share
More Decks by Celso Crivelaro
See All by Celso Crivelaro
Big Data para Gerentes de Projetos
celsocrivelaro
0
57
FileSystems em Ruby com FUSE
celsocrivelaro
2
64
Padrões e Boas Práticas de Teste de Tela
celsocrivelaro
0
410
Projeto de APIs
celsocrivelaro
0
160
Testing Network Conditions with ToxiProxy
celsocrivelaro
1
380
Testing Network Conditions with ToxiProxy
celsocrivelaro
0
80
Actor Model in Ruby
celsocrivelaro
0
250
Separando as regras de negócios do Rails
celsocrivelaro
0
180
InfluxDB + Grafana
celsocrivelaro
0
260
Other Decks in Science
See All in Science
01_篠原弘道_SIPガバニングボード座長_ポスコロSIPへの期待.pdf
sip3ristex
0
660
MCMCのR-hatは分散分析である
moricup
0
440
白金鉱業Meetup Vol.16_数理最適化案件のはじめかた・すすめかた
brainpadpr
4
2k
統計的因果探索: 背景知識とデータにより因果仮説を探索する
sshimizu2006
4
1k
Quelles valorisations des logiciels vers le monde socio-économique dans un contexte de Science Ouverte ?
bluehats
1
490
データベース10: 拡張実体関連モデル
trycycle
PRO
0
970
05_山中真也_室蘭工業大学大学院工学研究科教授_だてプロの挑戦.pdf
sip3ristex
0
630
How To Buy, Verified Venmo Accounts in 2025 This year
usaallshop68
3
270
Masseyのレーティングを用いたフォーミュラレースドライバーの実績評価手法の開発 / Development of a Performance Evaluation Method for Formula Race Drivers Using Massey Ratings
konakalab
0
190
My Favourite Book in 2024: Get Rid of Your Japanese Accent
lagenorhynque
1
110
深層学習を用いた根菜類の個数カウントによる収量推定法の開発
kentaitakura
0
180
データベース01: データベースを使わない世界
trycycle
PRO
1
770
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
30
9.6k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Visualization
eitanlees
148
16k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
Scaling GitHub
holman
463
140k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Building Better People: How to give real-time feedback that sticks.
wjessup
368
19k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.6k
Context Engineering - Making Every Token Count
addyosmani
1
18
Transcript
Sistemas de Recomendação Celso Crivelaro
Software Engineering @ Manager Professor IA e @ Big DaTa
Celso Crivelaro T: @celsocrivelaro E:
[email protected]
O que é um Sistema de Recomendação?
Trazer os tops itens para os Usuários Sistemas de Recomendação
Recomendação <> Busca Diferença: Recomendação é personalizada ao usuário. Busca é para uso geral
https://teses.usp.br/teses/disponiveis/3/3141/tde-26072013-121007/pt-br.php
None
None
None
None
None
Recomendação é um problema de Ranking
Muito provável clicar Menos provável
Muito provável clicar Estou em pânico Menos provável
Técnicas
Filtragem Baseada em Conteúdo
Usa-se os atributos dos itens para comparação Filtragem Baseada em
Conteúdo A recomendação se dá pela proximidade de um item aos itens consumidos pelo usuário Os itens com melhor ranking, aparecem no topo
Preciso definir quais atributos dos itens são relevantes Filtragem Baseada
em Conteúdo Definir pesos e utilidades de cada atributo e instância Os itens com melhor ranking, aparecem no topo
Gênero Atributos Ano de Publicação Palavras-chave
Algoritmo Clássico: IDF - TF
Mesmo usado pela busca (Lucene, engine do ELK, Solr) TF
- IDF Term Frequency - Inverse of Document Frequency Prioriza itens (documentos) com os atributos mais raros
Quando o uso é interessante
Em uma página, mostrar itens similares Usos Em uma base
nova, com poucas interações dos usuários Quando os itens têm atributos mapeáveis
Pontos Fracos
Forte tendência a indicar itens muito parecidos
Filtragem Colaborativa
Princípio: Pessoas parecidas têm gostos próximos Filtragem Colaborativa A recomendação
se dá pela proximidade de um item aos itens consumidos pelo usuário Parecido com o mundo real: Pessoas recomendam no boca-a-boca
Algoritmo Clássico: kNN
Primeiro: Mede-se quanto um usuário é igual aos outros
Segundo: Ao recomendar um item, tira-se a média ponderada pela
similaridade + fator de avaliação (nota)
Quando o uso é interessante
Quando a interação do usuário é fácil de buscar Usos
Aspecto social forte Repetição de padrões de comportamento de usuários
Pontos Fracos
Problema do novo Usuário: Como o usuário não tem itens,
qual recomendar? Pontos Fracos Idem para problema do novo Item Computação cara, precisa de várias heurísticas
Híbridos
Podemos usar as 2 abordagens aos mesmo tempo Sistemas Híbridos
Um pode ser filtro do outro ou dar boost no ranking Podemos usar Regras Conhecidas para filtrar resultados
Decaimento
Problema do Harry Potter
Itens com altíssimo ranking são recomendados sempre Problema do Harry
Potter
O que pode ser decaimento: Tempo, Distância, Volume Usar funções
de Decaimento Decaimento Exponencial
Como se avalia um RecSys?
Top N recomendações. Ideal: N = 5 Avaliação Precisão Recall
Precisão@N Recall@N
Como achamos que Recomendação pode ajudar?
Obrigado!