← 返回题库
传统算法中等

推荐系统冷启动怎么解决?

#冷启动#新用户#新物品#探索利用

题目

推荐系统的冷启动分为哪几类?请列出每类的常见解决方案。

参考答案

冷启动:无足够历史数据时难以精准推荐,分三类:

1. 用户冷启动(新用户)

  • 注册信息利用:地域、年龄、性别、设备等基础属性做人群包推荐。
  • 引导选择:首次进入让用户选兴趣标签(如 TikTok 注册后选话题)。
  • 热门/优质内容兜底:新用户先推全站热门,保证基线体验。
  • 跨域迁移:若用户在其他产品有数据,迁移画像(如微信读书用微信关系链)。
  • 快速学习:用户少量行为(几条点击)后立即用在线学习更新模型。

2. 物品冷启动(新物品)

  • 基于内容:用物品自身特征(标题、图、类目)找相似已存在物品,借它们的流量启动。
  • 流量扶持:给新物品曝光配额(如小红书对新笔记流量倾斜),收集反馈。
  • EE 探索:Bandit 类算法(如 LinUCB)在”利用热门”与”探索新品”间平衡。
  • 双塔内容召回:物品塔用内容特征编码,新物品无需历史即可被召回。

3. 系统冷启动(新系统)

  • 导入外部数据:竞品公开数据、行业通用热门榜。
  • 简单规则起步:先按热度/时间推,逐步积累数据再上复杂模型。
  • 迁移学习:从类似场景的预训练模型起步。

通用技术手段

  • Multi-Armed Bandit / UCB / Thompson Sampling:经典探索-利用算法。
  • 强化学习:把推荐建模为 MDP,长线优化用户生命周期价值。
  • 元学习:学一个”快速适应”的模型,少量样本即可个性化。
  • 图神经网络:利用用户-物品二部图结构,相似用户/物品的信息可扩散到冷启动节点。

面试加分点

  • 指出冷启动的本质是信息不足,所以解法都围绕”补信息”:用内容/属性补行为缺失,用探索换数据,用跨域/图结构借他人数据。
  • 强调**EE(探索与利用)**是长期价值的关键——纯利用热门会信息茧房,纯探索伤体验,需平衡。
  • 业务手段(流量扶持、引导选择)往往比算法更直接有效,体现”产品-算法协同”思维。

出处:推荐系统面经、掘金《推荐系统四层架构深度拆解》。

内容来源

整理自推荐系统面经与掘金相关文章

本站内容整理自公开面经与开源仓库,仅供学习交流,严禁杜撰。