百度视频推荐跨领域多目标估计与融合的实践与思考

1.百度视频背景介绍2.推荐系统概述3.多目标的设计与建模4.多目标融合内容校对｜李瑶出品社区｜DataFun01百度视频背景介绍1.统一产品形态一方面，百度A

2. 推荐系统概述

3. 多目标设计与建模

4. 多目标融合

内容校对李耀

制作社区DataFun

百度视频背景介绍

1、统一产品形态

一方面，百度APP内所有视频场景升级为统一的沉浸式（上下）交互形式；另一方面，基于百度统一的大模型，我们打通了全场景的数据和推荐体验。交互与数据的统一能够更好地实现生态共赢，促进百度视频的长远发展。

为了更好地培养用户的视频消费习惯，我们还打造了视频消费的一级入口（底部导航栏入口）。有兴趣的话可以下载百度APP。如果您有好的建议或者不好的案例，随时欢迎您向我们反馈。

2.搜索+推送双引擎，满足用户需求

值得一提的是，百度最初是作为搜索引擎起家的。搜索的使用率极高。需要在推荐场景中更好地利用搜索数据，通过“搜索+推送”的双引擎来满足用户的需求。搜索主要是“人找内容”，用户会明确输入自己的需求，而推荐则是“内容找人”。跨领域整合搜索信号和推荐信号，实现推荐和搜索更好的融合，也是百度的优势之一。

推荐系统概述

百度视频推荐跨领域多目标估计与融合的实践与思考

1.推荐系统解决的问题

考虑到很多听众都是非推荐背景，我简单介绍一下推荐需要解决的问题。推荐平台有3个玩家：

用户：在这里探索世界，发现新的感知；广告商：为平台生存提供资金支持。大多数平台都靠广告为生。推荐平台希望实现生产、消费、收入的良性循环。推荐系统作为平台的核心组件，主要解决两个问题：

极致用户消费体验（C端）：只有满足用户需求，才能推动规模不断提升。这是推荐系统的两个使命。我们后面设计目标的时候也会综合考虑这两方面。

2. 推荐系统概述

推荐系统的流程大致如下：经过审核的资源首先会被推送到存储元信息的统一前向数据库；推荐系统收到请求后，首先会通过图引擎、多目标召回等方式召回相关资源；召回后，会经过两个流程。多轮排序，包括粗排序和精排序，然后通过多目标融合模型，选择一些与用户强相关的内容；最后通过多样性感知、序列建模、流量分配机制等策略生成视频列表。发送至用户手机。

多目标设计和建模

首先，介绍视频推荐的多目标设计。

1. 目标设计的思考

首先请思考一下视频沉浸式场景下推荐系统的目标如何设计？

传统的推荐系统中，消费是通过点击内容或视频来完成的，用户通过点击行为明确表达自己对该资源的喜欢。因此，在传统的推荐场景中，点击是一个非常重要的信号，也是一个清晰简单的反馈。然而，沉浸式场景中缺乏清晰的反馈。用户的偏好通过“隐藏”的行为来表达，消费时间成为沉浸式推荐场景中非常重要的信号。

除了这些交互信号之外，百度APP推荐中还有一个非常重要的数据部分，那就是搜索信号。百度上70%的用户既会消费推荐信息流，也会使用搜索，因此推荐系统还需要刻画用户搜索领域。满意信号。

2.目标设计考虑的尺寸

百度视频推荐跨领域多目标估计与融合的实践与思考

3. 综合满意度建模

除了上述基本目标外，我们还会设计一些高层目标，不再简单地利用用户反馈。例如，如上图右侧所示，我们推出了基于用户满意度反馈的模型。第一阶段，通过广播完成度、时长等密集信号，利用简单的规则或模型来拟合用户满意度反馈，获得相对密集的用户满意度标签。第二阶段，基于该标签构建满意度模型，利用大规模推送搜索模型生成的Embedding、文信底层Embedding以及用户画像和行为序列特征建模来评估推荐领域相对的满意度增益到搜索域。如果用户在搜索中消费了某个兴趣点，推荐系统可以根据满意度模型推荐更高质量的内容，这样可以使搜索的融合更加顺畅，更好地将搜索兴趣迁移到Feed中。

4.长期价值建模（Long Term Value）

上一篇文章介绍了如何预估当前内容的播放时长和互动，以用户的历史消费行为作为样本或特征，预测即将播放的内容是否会有正面或负面的反馈，是否会有满意的互动和互动消耗。

进一步思考，用户未来消费的内容和当前消费的内容之间是否存在关系？例如，用户当前正在观看郭德纲的视频，如果他在接下来的第N天消费了于谦的视频，那么于谦的视频是否受到了郭德纲视频的“启发”？未来对兴趣点的消费是否可以视为当前兴趣点的“延续”？结果是积极的。因此，我们在系统中引入了LTV系统，将未来的长期价值内容归因于当前的视频推荐。

假设V0是当前视频的价值，V1，V2，Vn是用户将来会消费的视频。假设V2和Vn是令人满意的消耗并且是V0的延续，则它们可以归因于V0。

归因方法有很多种。根据百度Feed的业务场景，归因包括以下三个部分：

功能归属：如果通过相关推荐查看挂载的资源，那么这部分资源消耗信号可以归属于V0；召回关联的归因：例如召回阶段通过itemCF隐式召回等；相关性关联：例如可以通过多模态嵌入或者推荐的大模型嵌入来衡量资源之间的相关性。例如，如果Vn和V0具有相对较高的相关性得分，则Vn的值可以归因于V0。当然，这种归因是加权的。我们通过距离V0的时间间隔以及V0的相关性等因素来调整用户未来视频消费的归因权重，从而得到当前视频V0的长期价值。有了长远的价值目标之后，学习就相对简单了。第一步是标准化目标，然后直接对其进行建模。

简单总结一下，基于对当前业务情况的抽象和梳理，我们在设计推荐系统目标时，会从以下三个方向入手：

对于多目标，首先进行基本的物理目标建模，然后对一些高阶目标进行建模，以描述整个场景的满意度。同时，还需要规范生态，描述未来价值；总之，推荐系统的目标必须从多角度、多发展方向综合考虑。

5、百度Feed模型技术变革联动体验演进

百度推荐场景已经发展到目前的三大场景：

“推荐”信息流：已存在多年； “发现”场景：相比之下，主播更加信息化，而“发现”则更加活泼、贴近生活； “沉浸式”场景：纯视频消费流程。随着百度产品的发展，排名目标的估算也逐渐发展。从一开始的单一领域的主要目标，到多领域多目标，再到现在的综合建模的全领域综合多目标，将多个领域的样本整合在一起，充分共享信息。接下来我们将介绍全域的综合建模。

6. 跨领域多目标建模

百度视频推荐跨领域多目标估计与融合的实践与思考

首先，我们来看看行业都做了什么。无论是MMoE、PLE，还是阿里巴巴在做的STAR网络、PEPNet等架构，谷歌、腾讯等公司都在不遗余力地根据自己的业务进行各种设计。网络结构，希望在异构场景下共享更多有用的信息。主要解决两个大问题：

跨域信号迁移的问题是如何更好地在两个不同域之间迁移，实现跨域信息共享。多个目标之间的负迁移问题就是多个目标的跷跷板效应。百度推荐系统也面临着这两个问题。

百度的场景中子域目标较多，各个目标之间的相关性较低，很容易导致多个目标之间的负迁移。为了解决这个问题，需要分析不同目标之间的PNR，找出它们之间的相关性差异。即如何描述异构场景下的用户信息以及如何实现异构信息的迁移是模型结构需要解决的问题。

结合百度的业务，我们采用Gating结构设计了跨域分层多目标网络结构，主要分为三层：第一层是个性化的通用网络作为基础；第三层是个性化的通用网络。第二层是跨域信息提取GCG网络；最后一层是子域的多目标网络，使得每个域在共享信息的同时可以进行多目标估计。

该方案相对于单域多目标有了显着的改进。首次发布的AUC 大约高出3-9 千点。如上图右下角所示，获得多域用户特征的embedding并进行TSNE降维后，除了搜索C和第二跳比较接近外，其他两种场景区别还是比较大的明显，表明模型可以学习场景之间的差异。按理说，搜索C和第二跳场景没有太大区别。都是视频场景，用户的交互和兴趣差别不大。

百度的业务场景有40多个物理目标，4个大的子领域，6种形态，包括视频、图文、动态、小程序等，我们希望模型能够在很多复杂的业务中表现良好。我们简单介绍一下模型结构。第一层是公共网络，作为域划分的基础，筛选每个场景中多个目标的满意样本，并通过门网络实现个性化的嵌入映射。第二层是域间信息的提取，通过CGC网络实现域内独有的特征和个性化的共享特征。两者共同构建跨域信息抽取。优点是既保留了领域内的信息丰富性，又提取了异构场景的共享信息。第三层是子域的多目标建模。我们还就此主题发表了一篇相应的论文。对细节感兴趣的朋友可以阅读论文。

多目标融合

百度多目标融合的演进过程也比较贴近行业。首先是先验知识的融合，简单直接，但相对劳动密集型。然后我们升级到LTR，效果很明显。但缺点是业务发生变化时需要频繁调整。同时，偏序关系也随着业务和用户分层的变化而变化。后来我们还采用了多目标融合价值模型，采用了序贯优化方法。经过短暂的使用，我们升级到了目前使用的方法——ES（Evolution Strategy）进化学习。

我们的第一个版本是一个简单的启发式模型。目前的在线ES会做高阶计算，比如引入场景、群体分类等信息。

最后，我们正在招募，欢迎感兴趣的伙伴加入我们的团队。

人力资源邮箱：zhangxiao26@baidu.com