推荐系统多目标排序模型以及融合策略

技术文档

一、模型架构设计

多目标推荐模型采用共享底层参数的神经网络架构，通过多任务学习同时优化多个用户行为指标。如图1所示

推荐系统多目标排序模型以及融合策略
图1. 多目标模型架构（来源：王树森推荐系统课程）

关键行为指标定义

指标计算公式业务意义 CTR 点击次数/曝光次数内容基础吸引力 LikeRate 点赞次数/点击次数内容质量认可度 CollectRate 收藏次数/点击次数用户长期兴趣强度 ShareRate 转发次数/点击次数内容传播价值

转发行为具有网络效应，能为平台带来跨域流量，是重要的增长杠杆

二、输入特征体系

1. 特征分类

用户特征：ID、用户画像
物品特征：物品 ID、物品画像、作者信息
统计特征：30天窗口的行为统计（曝光、点击、转化）
- 如过去 30 天内用户对物品的曝光次数、点击次数、点赞次数、收藏次数、转发次数等行为数据的统计汇总。
- 物品统计特征：过去 30 天内物品被曝光的总次数、获得的点击次数、点赞次数、收藏次数、转发次数等统计信息。
场景特征：时空上下文（地理位置、节假日）

三、训练过程

采用加权多任务损失：
$\\mathcal{L} = \\sum_{i=1}^4 \\alpha_i \\cdot [-y_i\\log p_i - (1-y_i)\\log(1-p_i)]$

推荐系统多目标排序模型以及融合策略

四、负采样与校准技术

类别不平衡问题

以点击率为例，通常每 100 次曝光中仅有约 10 次点击，其余为无点击的负样本，这会导致模型训练时正样本信息被淹没。

行为转换典型比例（假设）不平衡度曝光→点击 10:90 9:1 点击→点赞 10:90 9:1

负采样解决方案

对负样本进行降采样，仅保留一部分负样本参与训练，使正负样本数量达到相对平衡状态，可减少计算资源消耗并提升模型对正样本特征的学习能力。

分层采样策略：
- 保留100%正样本
- 对负样本按比例降采样（采样率α）
- 典型采样率：α ∈ [0.1, 0.3]
采样后预估校准：
- 真实点击率： $p_{\\text{true}} = \\frac{n_+}{n_+ + n_-}$
- 采样后预估值： $p_{\\text{pred}} = \\frac{n_+}{n_+ + \\alpha \\cdot n_-}$
- 校准公式：
  $p_{\\text{true}} = \\frac{\\alpha \\cdot p_{\\text{pred}}}{(1 - p_{\\text{pred}}) + \\alpha \\cdot p_{\\text{pred}}}$

校准操作流程

训练阶段->>在线服务：输出原始预估值p_pred
在线服务->>校准模块：输入p_pred
校准模块->>排序模块：返回 $p_{true} = α·p_{pred} / [1-p_{pred} + α·{p_pred}]$
排序模块->>推荐结果：使用校准后分数排序

五、排序与融合策略

一、基础加权融合法

1. 线性加权融合

$\\text{Score} = p_{click} + w_1 \\cdot p_{like} + w_2 \\cdot p_{collect} + w_3 \\cdot p_{share}$

特点：

实现简单，计算效率高
各指标权重需通过A/B测试调优
适合指标间相对独立场景

2. 点击率主导融合

$\\text{Score} = p_{click} \\times (1 + w_1 \\cdot p_{like} + w_2 \\cdot p_{collect} + \\cdots)$

数学解释：

$p_{click} \\times 1$ ：基础点击概率
$p_{click} \\times p_{like}$ ：曝光→点击→点赞的联合概率

优势：

符合用户行为序列的因果逻辑
自动放大高点击内容的次级行为价值

二、工业级融合方案

每个指标的意义：

指标业务意义点击率基础用户体验点赞率内容质量感知收藏率长期用户价值转发率平台增长杠杆

1. 海外短视频平台方案

采用幂次连乘法：
$\\text{Score} = (1 + w_1 \\cdot p_{time})^{a_1} \\times (1 + w_2 \\cdot p_{like})^{a_2} \\times \\cdots$

参数说明：

$w_i$ ：行为权重系数
$a_i$ ：非线性放大系数
$p_{time}$ ：预估观看时长（秒）

设计原理：

1 + w*p保证基础分不为零
幂次运算增强头部效应
连乘突出综合体验

2. 国内某短视频方案（排序分转换）

分阶段处理：

单指标排序：
- 对每个指标独立排序得到排名 $r_i$
排名分转换：
$f(r_i) = \\frac{w_i}{r_i^{a_i} + \\beta_i}$
最终融合：
$\\frac{w_1}{r_{time}^{a_1} + \\beta_1 } + \\frac{w_2}{r_{click}^{a_2} + \\beta_2} + \\frac{w_3}{r_{like}^{a_3} + \\beta_3 } + ...$

关键参数：

参数作用

a

头部集中度

\\beta

平滑因子

优势：

消除不同指标量纲差异
自动处理长尾分布
增强头部内容区分度

3. 电商平台方案（行为链模型）

用户路径：

#mermaid-svg-zBMuRQjrO8YXPMVC {font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-zBMuRQjrO8YXPMVC .error-icon{fill:#552222;}#mermaid-svg-zBMuRQjrO8YXPMVC .error-text{fill:#552222;stroke:#552222;}#mermaid-svg-zBMuRQjrO8YXPMVC .edge-thickness-normal{stroke-width:2px;}#mermaid-svg-zBMuRQjrO8YXPMVC .edge-thickness-thick{stroke-width:3.5px;}#mermaid-svg-zBMuRQjrO8YXPMVC .edge-pattern-solid{stroke-dasharray:0;}#mermaid-svg-zBMuRQjrO8YXPMVC .edge-pattern-dashed{stroke-dasharray:3;}#mermaid-svg-zBMuRQjrO8YXPMVC .edge-pattern-dotted{stroke-dasharray:2;}#mermaid-svg-zBMuRQjrO8YXPMVC .marker{fill:#333333;stroke:#333333;}#mermaid-svg-zBMuRQjrO8YXPMVC .marker.cross{stroke:#333333;}#mermaid-svg-zBMuRQjrO8YXPMVC svg{font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:16px;}#mermaid-svg-zBMuRQjrO8YXPMVC .label{font-family:\"trebuchet ms\",verdana,arial,sans-serif;color:#333;}#mermaid-svg-zBMuRQjrO8YXPMVC .cluster-label text{fill:#333;}#mermaid-svg-zBMuRQjrO8YXPMVC .cluster-label span{color:#333;}#mermaid-svg-zBMuRQjrO8YXPMVC .label text,#mermaid-svg-zBMuRQjrO8YXPMVC span{fill:#333;color:#333;}#mermaid-svg-zBMuRQjrO8YXPMVC .node rect,#mermaid-svg-zBMuRQjrO8YXPMVC .node circle,#mermaid-svg-zBMuRQjrO8YXPMVC .node ellipse,#mermaid-svg-zBMuRQjrO8YXPMVC .node polygon,#mermaid-svg-zBMuRQjrO8YXPMVC .node path{fill:#ECECFF;stroke:#9370DB;stroke-width:1px;}#mermaid-svg-zBMuRQjrO8YXPMVC .node .label{text-align:center;}#mermaid-svg-zBMuRQjrO8YXPMVC .node.clickable{cursor:pointer;}#mermaid-svg-zBMuRQjrO8YXPMVC .arrowheadPath{fill:#333333;}#mermaid-svg-zBMuRQjrO8YXPMVC .edgePath .path{stroke:#333333;stroke-width:2.0px;}#mermaid-svg-zBMuRQjrO8YXPMVC .flowchart-link{stroke:#333333;fill:none;}#mermaid-svg-zBMuRQjrO8YXPMVC .edgeLabel{background-color:#e8e8e8;text-align:center;}#mermaid-svg-zBMuRQjrO8YXPMVC .edgeLabel rect{opacity:0.5;background-color:#e8e8e8;fill:#e8e8e8;}#mermaid-svg-zBMuRQjrO8YXPMVC .cluster rect{fill:#ffffde;stroke:#aaaa33;stroke-width:1px;}#mermaid-svg-zBMuRQjrO8YXPMVC .cluster text{fill:#333;}#mermaid-svg-zBMuRQjrO8YXPMVC .cluster span{color:#333;}#mermaid-svg-zBMuRQjrO8YXPMVC div.mermaidTooltip{position:absolute;text-align:center;max-width:200px;padding:2px;font-family:\"trebuchet ms\",verdana,arial,sans-serif;font-size:12px;background:hsl(80, 100%, 96.2745098039%);border:1px solid #aaaa33;border-radius:2px;pointer-events:none;z-index:100;}#mermaid-svg-zBMuRQjrO8YXPMVC :root{--mermaid-font-family:\"trebuchet ms\",verdana,arial,sans-serif;} 曝光点击加购付款

融合公式：
$\\text{GMS} = p_{click}^{a1} \\times p_{cart}^{a2} \\times p_{pay}^{a3} \\times \\text{price}^{a4}$

参数设计：

当 $a 1 = a 2 = a 3 = a 4 = 1$ 时：
- GMS = 点击率 × 加购率 × 付款率 × 价格
- = 期望GMV（商品交易总额）

三、方案对比

方案类型适用场景计算复杂度线性加权快速迭代低点击率主导内容推荐中幂次连乘视频/图文高排序分转换多目标长尾分布高行为链模型电商交易场景中

结论：多目标模型通过联合优化多个用户行为目标，显著优于单目标模型，尤其在提升用户长期价值和平台增长方面效果突出。负采样与校准技术有效解决了样本不平衡问题，使模型预估更贴近真实场景。

引用

参考文献：
[1] Shusen Wang. 推荐系统课程. Bilibili, 2022.
[2] Facebook. Practical Lessons from Predicting Clicks. 2014.

推荐系统多目标排序模型以及融合策略

一、模型架构设计

关键行为指标定义

二、输入特征体系

1. 特征分类

三、训练过程

四、负采样与校准技术

类别不平衡问题

负采样解决方案

校准操作流程

五、排序与融合策略

一、基础加权融合法

1. 线性加权融合

2. 点击率主导融合

二、工业级融合方案

1. 海外短视频平台方案

2. 国内某短视频方案（排序分转换）

分阶段处理：

3. 电商平台方案（行为链模型）

三、方案对比

引用

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签

推荐系统多目标排序模型以及融合策略

一、模型架构设计

关键行为指标定义

二、输入特征体系

1. 特征分类

三、训练过程

四、负采样与校准技术

类别不平衡问题

负采样解决方案

校准操作流程

五、排序与融合策略

一、基础加权融合法

1. 线性加权融合

2. 点击率主导融合

二、工业级融合方案

1. 海外短视频平台方案

2. 国内某短视频方案（排序分转换）

分阶段处理：

3. 电商平台方案（行为链模型）

三、方案对比

引用

相关问题

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签