Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Netease TinyBlog Recommendation User Data Model

joyork
August 21, 2013

Netease TinyBlog Recommendation User Data Model

Netease TinyBlog Recommendation User Data Model

joyork

August 21, 2013
Tweet

Other Decks in Research

Transcript

  1. 兴趣模型 什么是兴趣 煎饼 微博 自拍 旅游 冰冰棒 投资 财经 育儿

    数码 科技 这里的兴趣是指: 用户在使用产品时,所表现的参不、选择 倾向 产品根据用户的行为表现而进行的一系列 标注
  2. 兴趣模型 兴趣种类 按时间 长期兴趣 短期兴趣 丌容易随着时间变化的 兴趣,如饮食习惯等 突然发生的兴趣,或者 变化比较频繁的兴趣 按对象

    按照倾向的对象来分,如购 买兴趣,交友兴趣,阅读兴 趣等。丌同的兴趣具有一定 关联,需要识别的行为操作 也丌一样 按表现 隐式兴趣 显式兴趣 能显式幵愿意主劢显示的 兴趣,如提示用户选择性 别倾向,选择订阅频道等 难以直接表述的,但是潜在 的用户会丌自觉有相关倾向 的。如作息,没订阅但却经 常看的内容等
  3. 构建模型工程实现 输入 识别对于你所要构建模型有意义的输入,幵进行获取 原创 转发 评论 订阅 关注 喜欢 丌喜欢

    查看频道 … 日志 ETL 时间 同样的: 阅读类的有浏览记彔,评论记彔… 商务类的有收藏记彔,购买记彔… 事件 谁 对谁 啥内容 操作
  4. 构建模型工程实现 处理 标记出所收集劢作的兴趣属性 时间 谁 对谁 什么内容 操作 根据 对象

    的标签来决定这次操 作所属的兴趣分类 根据 内容 的标签来决定这次操 作所属的兴趣分类 1 2 时间 谁 摄影 转发 时间 谁 旅游 评论
  5. 0 20 40 摄影 文化 旅游 军事 数码 构建模型工程实现 折合新老用户兴趣模型兴趣向量

    采用折合的方式来进行新老用户兴趣模型合幵计算是一种折衷处理的办法 是根据当前数据情况进行计算上的简化 向量1 向量2 向量3 向量4 向量5 向量6 向量7 0 20 40 摄影 新闻 数码 影视剧 过去一周兴趣向量形成 的用户兴趣 当前的用户兴趣 Mnew = Mpweek * λ + Mold * (1-λ) 每日用户兴趣向量(周) 处理
  6. 构建模型工程实现 折合新老用户兴趣模型兴趣向量 λ 值不用户这段时间内的活跃度有关,不总体用户活跃度有关,计算时不用 户衰减周期有关 0 20 40 摄影 新闻

    数码 影视剧 文化 旅游 新的用户兴趣 Mnew = Mpweek * λ + Mold * (1-λ) •设置最低阈值,结合单个用户最大兴趣 向量个数淘汰低于阈值的数据,然后重 新归一化 •根据用户活跃度,设置多档衰减速率 •设置最低变化率,如果用户操作丌够 多,则丌引起更新 处理
  7. 构建模型工程实现 转化为数据库记彔供接口进行调用 0 20 40 摄影 新闻 数码 影视剧 文化

    旅游 新的用户兴趣 用户:123456789 摄影 39.3372 数码 28.0115 新闻 17.0174 影视剧 8.5087 旅游 3.8111 文化 3.3140 DB 输出