在推荐系统当中,一旦策略产品经理和算法工程师在商量与构建优化目标不够准确,这会带来的后果就是和实际期望的效果南辕北辙、大相径庭,甚至给整个公司业务目标、商业收入带来致命的影响。有一句话说的很好:如果一项技术本身是新颖并且先进的,但是应用的方向和实际需求的方向有很大的偏差,那么这项技术的成果不可能是显著的。
做策略产品在构建你的目标的时候,一定要像毛主席说的那样“战术上藐视敌人战略上重视敌人”。切忌不能用战术上的勤奋掩盖战略上的懒惰,所以合理设定与构建推荐系统业务目标建模应该是推荐策略产品经理需要再构建推荐系统业务目标排序的时候应该首要考虑的问题,这也是Arthur在这里着重强调业务建模的重要性。这里以抖音短视频、京东作为推荐系统的两个案例,来讲讲内容推荐场域、电商推荐场域下构建优化目标建模的差异。
抖音短视频的主要商业模式是通过免费视频播放带来的广告收入(此处仅说明巨量广告,非巨量千川广告,CPM计费),其视频广告会在自然推荐的媒体视频之间进行穿插,因此抖音本身的广告收入适合用户的观看时长、下拉短视频数量呈现正比关系的。因此为了达成抖音短视频的商业目标,其优化核心建模不是围绕点击率CTR、等传统推荐系统意义上的CTR预估优化目标,而是用户的有效播放时长。
图1-1 抖音推荐系统
如上图所示,我们逻辑推演与猜想下来看,用户的点击率CTR在数据分布上会与用户的短视频播放时长有一定的正相关性,但是两者还是存在“用户、物料特征”以及“优化动机”上存在一定的差异。
图1-2 抖音夸张式吸睛内容
如果推荐系统是优化点击率来看的话,那么推荐系统模型侧重就会以优化——创意优选/生成部分,推荐“标题党”、“吸睛眼球一跳”等虚假、色情类吸引眼球的短视频,这一类短视频的特点就是点击率CTR贼高,但是用户一旦发现虚假宣传就会跳失,客户观看时长较短,对劣质内容缺少观看下去的耐心。
图1-3 抖音优质内容
如果推荐系统是优化观看时长来看的话,更多的就需要考虑视频本身的质量、内容的兴趣度,用户视频的互动、好评以及视频本身的长短特征内容,此时推荐 优质的内容 > 吸睛的内容。
所以综上述来看推荐目标建模的差异其实就直接导致了推荐系统倾向性、特征工程等细节策略工作的不同,进而就直接影响了“增加用户播放时长”这个集团商业化目标。
我们借助Youtube在推荐系统模型来距离推演一下(抖音与youtube在优化视频优化目标上有一定的相似性,因此可以作为借鉴),引入播放时长作为优化目标。其本质还是把推荐视频的问题看做是一个分类问题对待,也就是预测用户是否点击某个视频。
这一点大家肯定会比较好奇,Arhtur的老粉应该知道,预测短视频的播放时长应该是个回归问题(预测离散数值),而不是个分类问题。Youtube巧妙就在于其把播放时长转化成了正样本的权重,输出层再利用加权的逻辑回归进行训练,预测过程中利用算式来计算样本的概率,这个概率就是模型对播放时长的预测,这就完美的把逻辑回归输出的结果映射成了对于观看时长的预测。
图1-4 Youtube推荐模型框架设计
从左往右的部分用的是依次是视频观看的低维稠密embedding向量,包括历史看过的视频id,曝光视频id、互动行为下的视频id等等然后做平均池化。第二个是语言Embedding,主要是用户语言以及视频语言。第三个是对上次观看时间进行归一化。第四个是对已经曝光次数进行归一化。
由此而看,视频对于播放时长的预测是符合抖音、Youtube视频类型广告盈利模式和商业价值的,制定一个合理的优化目标对于推荐系统实现商业目标是关键而且非常有必要的。
在淘宝等电商类网站做推荐,用户从登陆到购买的过程可以划分为两步:
第一步,商品发生曝光行为,用户点击后进入商品详情落地页。
第二步,用户在商品内页发生成交、下单行为。
电商网站推荐系统的商业目标是通过推荐使用用户产生更多的点击、购买行为。所以如果按照这个商业建模目标来说应该是一个CVR预估模型。
图1-5 淘宝、京东推荐系统
但是大家应该有所发现,下单成交的行为其实是发生在了第二步,故推荐CVR模型在进行训练的时候光训练点击后的成交转化行为样本其实是脱节的——客户并不是登陆电商APP就直接到了商品详情页,一定是曝光一跳页面点击发生之后预估转化CVR模型才会有效。如果直接在一跳创意信息流情形暴力预估转化率CVR,肯定会有预估偏差,导致效果与目标的不一致问题。
图1-6 训练空间和预测空间不一致问题
如1-6所示,点击Click点击 -> Conversion转化和Impression展现 -> Click点击,存在样本空间衔接,但是本身是相互独立的,两者没有完全的正相关关系,所需要的样本、模型需要的特征、属性都是不一样的。例如点击可能只是看用的兴趣,可以用比较吸引眼球的创意 99%的人都在卖,100%好评,70%的都在回购等。但是成交考虑的特征可能更多的就是物品的优惠程度、用户的消费力等特征。
所以,最佳的思路方法还是分两步来构建模型,第一步构建CTR点击率预估模型,第二步构建点击转化的CVR预估模型。这个方法有个缺陷就在于第一步CTR模型预估其实和最终的优化目标是脱节的,因为问题的最终是希望优化下单成交而不是点击,在第一步只考虑点击数据显然不是全局最优。
为了同时达到电商场景的上述两阶段目标,阿里提出了多目标ESSMM模型(Entire Space Multi-task Model)。其同时模拟优化CTR、CVR两个阶段。
图1-7 ESSM优化模型架构图
上述为阿里的ESSM模型,最下层分别是CVR预估模型用户域、商品域Embedding和CTR预估模型用户域、商品域Embedding,两者中间的Shared Lookup Table是通过标的形式共享Embedding的内容,目的就是为了解决CVR因为正样本系数的问题,利用CTR数据生成更加准确的用户和物品的特征向量表达。
中间的神经网络域感知池化层、多层感知机,两个目标的模型各自独立完全隔离,去拟合各自的优化目标pCVR和pCTR,最终在最上部分预估点击率pCTR和预估转化率pCVR相乘得到最后的结果预估点击转化率pCTCVR,两者之间的关系如下图所示。
pCTCVR是左侧,指代一个条件概率事件,首先必须要发生曝光点击行为,即p(y = 1 | x),再来计算CVR转化概率。ESSM即同时将pCVR、pCTR以及pCTCVR三个目标统一融入到一个模型当中,可以得出三个优化目标的值,可以根据对应的目标场景预测对应的值,一个多目标优化的模型即解决前面说的“训练样本的空间和模型预估优化空间不一致”的问题,同时也实现了曝光点击和点击转化的全局优化效果。
所以从上述的例子可以看出来,无论是抖音、YouTube,还是淘宝、京东,推荐系统的应用场景和真正的商业目标其实是有差异的,并不是推荐系统可以“一招鲜吃遍天”的方式进行优化,所有的推荐系统都按照一个优化目标方向都采用统一的模型去优化。
很多策略产品、算法工程师都是直接调研照抄行业最领先的模型,表示“阿里用的就是这个,你别管做完实验推全就行了”,这是典型的没有将实际业务场景和策略目标相结合。
为什么一直鼓励大家一定要距离业务更近一点?对业务目标建模后面才是我们运用“策略”这个工具帮助我们高效去实现业务目标的达成,每一个策略产品首要遵循的原则就是结合公司业务发展的阶段与场景,来实现优化目标的落地,这不是一个纯粹的系统性技术问题,而是多方协调一致的结果,需要产品、运营,前台内容团队共同协商达成的结果,只有确定好优化目标,技术团队才可以转型的致力于模型的改进和调整,上下同心去解决公司的也目标,避免战略性的错误和失败,提高各方效率。
最后,还是一句建议给到策略产品经理的小伙伴们:战术上藐视敌人战略上重视敌人,切忌不能用战术上的勤奋掩盖战略上的懒惰。如果有帮助大家希望大家帮忙点赞、评论与收藏,这个对我很重要。
本文由 @策略产品Arthur 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。