跳转至

物品冷启动

冷启动指的是从无到有的过程:

IMAGE_1775559525806 UGC(用户生成)的冷启动尤为困难,PGC(平台生成)则相对容易。

为什么要做冷启动?

换言之:为什么需要对新内容特别对待

IMAGE_1775559599685

冷启动的目标

IMAGE_1775559784581 评价指标主要分为下面几种:

  • 作者侧(冷启动能否激励作者发布内容):发布渗透率、人均发布量
  • 用户侧(冷启动能否精准推荐、是否引起用户反感):新笔记指标(点击、交互)、大盘指标(消费时长、日活)
  • 内容侧(冷启动能否挖掘优质笔记):高热笔记占比

作者侧指标

IMAGE_1775560042439

IMAGE_1775560097024

用户侧指标

最好区分高曝光/低曝光笔记的消费指标,尤其是低曝光,需要更多关注。高曝光笔记不需要精确的推荐也能得到很好的指标。

IMAGE_1775560143457 跷跷板效应:大力扶植低曝光笔记会降低大盘指标,因为这些低曝光笔记数据不足、推荐不够精准,用户体验会下降

IMAGE_1775560217855

内容侧指标

IMAGE_1775560309467

冷启动的技术点

  • 优化推荐的全链路(召回和排序):新物品在推荐系统中如何被对待
  • 流量调控:流量在新、老物品之间的分配

召回冷启动

召回需要一些依据,但是新笔记有所欠缺:

IMAGE_1775560578080

  • 缺少用户交互,笔记ID Embedding没有学好,双塔模型效果就不好
  • 缺少用户交互,ItemCF也不适用,因为计算相似度的时候需要用到用户偏好(感觉UserCF更加不适用)

IMAGE_1775560766857

双塔模型的改造

  • 方案一:使用Default Embedding(这个向量不是随机的,而是学习出来的,作为新笔记的默认嵌入向量
  • 方案二:使用类似笔记的Embedding平均

IMAGE_1775561063011

IMAGE_1775561105866 实践中使用多个向量召回池,来保证新笔记的曝光机会:

IMAGE_1775561149011

类目/关键词召回

IMAGE_1775561248706 这两种有些显而易见的缺点:

IMAGE_1775561381590

聚类召回

IMAGE_1775561443658

IMAGE_1775561523318

IMAGE_1775561538123 聚类召回和关键词召回有类似的缺点,只会召回比较新的笔记。 内容相似度模型的构建:

IMAGE_1775561633531 内容相似度模型的训练:

IMAGE_1775561686730 损失函数:

IMAGE_1775561717007 数据集构建:

IMAGE_1775561756920

IMAGE_1775561795649

Look-Alike召回

Look-Alike本身是互联网广告算法

IMAGE_1775561849207

IMAGE_1775561887308 用户扩散的重点在于计算用户相似度:

  • UserCF:用户有共同的兴趣点
  • Embedding:用户嵌入向量余弦距离 实践过程中,可以使用新笔记交互过的所有用户(种子用户)Embedding平均作为该新笔记的特征向量(喜爱该笔记的平均用户),而后在召回的时候根据用户Embedding和特征向量的相似度来召回。

IMAGE_1775562136715

流量调控

IMAGE_1775562242357

IMAGE_1775562291576 提权:固定系数

IMAGE_1775562360192 保量:梯度系数,差异化权重

IMAGE_1775562394622 为什么不简单粗暴地提高分数?

虽然曝光提高了,但推荐的效果可能下降,把笔记推荐给不合适的用户

IMAGE_1775562516724

IMAGE_1775562588273 差异化保量:根据内容质量的高低(字数多少等等)来设置不同的保量目标

IMAGE_1775562626559

冷启动的AB测试

指标:

IMAGE_1775562763162 冷启动的AB测试很麻烦。

  • 冷启动的用户侧实验:

IMAGE_1775562834997 这个实验中,会有变量混杂:

IMAGE_1775562910244

IMAGE_1775562935473

  • 冷启动的作者侧实验,方案一:

IMAGE_1775563027731

IMAGE_1775563134691

IMAGE_1775563269020

  • 冷启动的作者侧实验,方案二:

IMAGE_1775563297765

IMAGE_1775563413079

  • 冷启动的作者侧实验,方案三: (相当于把小红书分成两个app,但是实践中不太现实,会损害用户体验,不划算)

IMAGE_1775563433663


最后更新: 2026-04-07 20:19:13
创建日期: 2026-04-07 20:19:13

广告

人要恰饭的嘛🤑🤑

评论