从《社交网络》到豆瓣评分,这些都是用户评分的表现。文章介绍了用户评分算法的体系,并以豆瓣评分为例,展开了详细说明,包含贝叶斯公式和威尔逊区间法,与大家分享。

评分算法(1):用户评分

开一个新的系列:评分算法,先讲用户评分。

从下图的电影《社交网络》开始讲起,玻璃上的公式是ELO排名算法,可以将比较打分的结果量化为分数,为女生打分,这种算法目前主要应用在对战类游戏的排序中。这个算法我们不展开讲,感兴趣的朋友可以去网络搜相关资料。

评分算法(1):用户评分

我先给评分算法一个简单的定义:评分算法就是通过对已有数据进行计算,量化评估某一类主体,从而实现对这一类主体的评价、考核和管理。在前面提到的例子中,被打分的主题就是大学女生的相貌,数据就是用户的打分。

在当前互联网中,产品连接着用户、商品、内容、服务、服务者,每一类主体都有着大量数据,评分方便其他角色对这些主体进行统一评估。与此同时,配送员、司机、教师、客服、销售这样的角色已经实现了自动化的分配,利用评分将这些角色的表现量化和可视化,也有利于对这些角色进行有效管理。

早上打车上班,如果你给司机一个评价,这个评价会被计入司机的服务分,影响司机师傅的派单和收入。中午打算点个外卖,你翻开了美团,看着商家评分,最终选择了你的外卖。晚上打算看个电影,翻看豆瓣电影评分,选择了一款评分不错的电影。作为消费者,评分无时不刻不在影响我们的消费选择,而我们的评分也成为了商业公司内部评分体系的一个数据源。

消费的评分体系相对比较简单,只涉及用户评价这一单一数据源,而内部评分体系需要考虑更多因素。本期先聊消费者评分,以豆瓣评分为例。

基于用户评价的排序策略,会面临不同内容的评分人数差距过大的问题。比如图书A有100个人打分,平均分是4.5分,图书B有5个人打分,平均分是4.6分,而同时全站平均分是3.0分,那么我们应该怎么给用户推荐呢?第一种思路是可以针对数据量少的打分,做一定程度的降权,如用下面较为简单的置信度降权函数:

rank=N/(N+X)·score

其中N为评分的数量,score为原始的评分值,X为可调节的参数。将X设为5时,函数为

rank=N/(N+5)·score

经过降权后,图书A的得分是4.29,图书B的得分是2.3,图书A的得分相对比较合理,但图书B远低于原始评分4.6,也低于全站平均分,可见这种方法对数据量小的内容有很大的抑制。用贝叶斯平均法便可避免这一问题,也就是第二种思路。

贝叶斯公式是统计学中的一个基本工具,可以作为很多策略设计的依据。还是用这个例子介绍其原理,即当一个内容还没有或者只有少量评分的时候,可以先认为这个内容的评分和大部分内容的平均评分差不多,只有当对这个内容的评分越来越多的时候,才能得到这个内容的评分。通用的贝叶斯平均公式如下,其中average表示全站平均分。

rank=X/(N+X)·average+N/(N+X)·score

依然假设X为5,全站平均分为3.0,那么图书A的得分是4.42,图书B的得分就是3.8。图书B的得分比置信度降权法高,且高于全站平均分,相对更加合理。

在有些场景下,如果希望评价少的内容出现在后面,则置信度降权法比贝叶斯平均法更适用;而希望给评分少的内容足够曝光时,贝叶斯平均法就比置信度降权法更适用。

当然,以上的调整方法看起来缺乏一些数学上的严谨性,那么有没有更严谨的算法呢?答案是肯定的。我个人觉得比较可靠的情况下是使用威尔逊区间法。

评分算法(1):用户评分

威尔逊区间可以在给定置信度的情况下,给出打分概率的置信区间。一般使用情况下,威尔逊区间适用于零一变量。比如用户是否点击视频、图片、广告,p就是用户点击概率,n是统计的数据量,z是给定置信度参数,常用的几个值,90%置信度下z=1.64,95%置信度下z=1.96,99%置信度下z=2.58,其他的都可以查表。在打分场景下,需要做的事情是将打分均值归一化为p值,比如平均分时3.5,满分5分,那么就是3.5/5=0.7。同时n取打分人数,z已经是置信度参数。

威尔逊区间法的好处是多样的。首先是统计上的合理性,无论数据量大小,都有一致的数学表达式。其次是在区间的上下界都有其业务意义。

在数据量较小的情况下,数据均值一定是不准的,对于业务而言,某些场景他们需要的是数据的上界,某些场景他们需要的是数据的下界。

比如,在排序策略中,当我们希望给长尾内容更多流量的时候,可以使用上界,当我们希望突出热门内容时,可以使用下界。

比如,在广告策略中,当我们希望关闭CPA过高的广告时,我们应该用下界,当我们希望关闭点击率更低的广告时,应该用点击率的上界。因为我们需要给新的广告更多的试探空间。

当然威尔逊区间算法的本质是提供了一个将大数据量内容和小数据量内容一起对照的方法,应用范围也不止于此,而“小数据下不置信”是大量策略系统的共同问题。

本期内容到此结束,下一期我们聊评分算法的另一个场景,服务分。

#专栏作家#

潘一鸣,公众号:产品逻辑之美,人人都是产品经理专栏作家。毕业于清华大学,畅销书《产品逻辑之美》作者;先后在多家互联网公司从事产品经理工作,有很多复杂系统的构建实践经验。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议




阻力设计在产品中的应用

阻力设计在产品中的应用

阻力是指物体在流体中相对运动所产生与运动方向相反的力,不仅在自然间中常见,在互联网中也广泛存在。本文作者从五个角度,深入分析阻力设计在产品中的应用,希望对你...

2020-06-18
如何成为一个合格的数据架构师?

如何成为一个合格的数据架构师?

数据架构师在互联网行业中是个很重要的职位,是企业数据资产最重要的“奠基者”。那么,如何成为一个合格的数据架构师呢?本文作者基于自身经历,从三个方面展开介绍,推...

2020-06-18
倒推“抖音短视频”APP产品需求文档

倒推“抖音短视频”APP产品需求文档

文章是倒推“抖音短视频”APP产品需求文档,但由于作者是第一次写需求文档,所以仅对核心需求进行了需求分析与说明。一起来看看~ 目录: 一、文档综述 1.1文档属性 1.2产...

2020-06-18
微信“拍一拍”,真的是一个没什么用的功能吗?

微信“拍一拍”,真的是一个没什么用的功能吗?

昨天微信上线了“拍一拍”功能,用户点击2次头像,会产生头像抖动,震动反馈,且在聊天框中显示“XX拍了拍XX”。 这个功能推出后,很多微信群都在疯狂拍一拍,引起了一波拍...

2020-06-18
数据大屏设计师,我不信你没有这些困惑(上)

数据大屏设计师,我不信你没有这些困惑(上)

从事互联网行业的人,每天都在接收新知识,时常也会有迷惑的时候,尤其是数据大屏这样比较少有人踏足的领域。本文作者以自身经历出发,对数据大屏设计提出了自己的一点...

2020-06-18
客户关系管理的15个模型总结(下)

客户关系管理的15个模型总结(下)

对于ToB产品,仅仅基于用户需求来设计产品架构是远远不够的。B端产品服务的是有着几年,甚至几十年管理积淀的企业,必须依靠一定的理论知识来支撑系统的设计规划。本文...

2020-06-18
B端产品设计:价值主张与需求对应的价值

B端产品设计:价值主张与需求对应的价值

B端产品的需求来源于场景,产品经理通过满足客户需求从而产生价值。因此,SaaS产品经理面对扑面而来的需求时,应当更清晰理解并评判需求的价值。 01 2008年,著名商业...

2020-06-18
以知乎为例,探讨未来产品设计的几大变化

以知乎为例,探讨未来产品设计的几大变化

知乎作为一个典型的问答社区,它本身反映了内容社区产品的很多典型问题。本文以知乎为例,探讨社区类产品未来发展的一些变化,对内容社区感兴趣的童鞋不要错过。 前段...

2020-06-18
如何用产品思维打造线上课程?

如何用产品思维打造线上课程?

如何用产品思维来给自己打造一个线上课程呢?本文从市场调研、课程开发、运营推广、成交这几个方面分享如何打造自己的课程,希望对大家有所帮助~ “地摊经济”重出江湖,...

2020-06-18
「武侠连载」营销中心设计——优惠券

「武侠连载」营销中心设计——优惠券

优惠券是常见的一种营销推广的方式,但是你真的了解它吗?本文作者以武侠故事的形式,对优惠券展开了生动的分析,对优惠券感兴趣的童鞋不要错过哦。 (武侠情节接上文“...

2020-06-18
金融支付财务融合业务-实践分享1:订单、账单、交易流水、账套知识解构、原理解析

金融支付财务融合业务-实践分享1:订单、账单、交易流水、账套知识解构、原理解析

本文作者从实际工作实践出发,结合案例等分享了电商金融支付财务融合中的基本概念和相关原理解析,包括:订单、账单、交易流水和账知识解构,供大家一同参考和学习。 ...

2020-06-18
关于卡片设计的分析与思考

关于卡片设计的分析与思考

卡片是APP常见的设计形式,它既有好处也有弊端,因此需要根据场景和内容确定展现形式。本文从四个方面对卡片设计展开分析,推荐给对卡片设计感兴趣的童鞋阅读。 卡片是...

2020-06-17
内容型产品中,付费会员功能如何设计?

内容型产品中,付费会员功能如何设计?

付费会员制度让用户预付会员费,将钱留在平台,那么未来一定会有消费行为,那么会员制度要如何设计,才能激励用户付费呢? 01 为什么要做付费会员? 讨论这个问题之前...

2020-06-16
文字社区是否可以拥有弹幕?

文字社区是否可以拥有弹幕?

从社区产品的角度来思考,弹幕功能对于内容生产方,内容消费方以及平台方而言各自有什么意义?图文内容社区是否有机会拥有弹幕呢?如果可以发弹幕,用怎样的形式呢?本...

2020-06-16
FMS财务系统收支结算总结

FMS财务系统收支结算总结

本文按照FMS收支结算划分,结算流程分类及各系统交互,财务系统内部结算基础能力,收支结算整体结构的顺序来依次介绍,总结财务系统收支结算的结构,和一些作者的个人思...

2020-06-16
如何迅速提升用户好评?试试这三种方法

如何迅速提升用户好评?试试这三种方法

小编推荐:如何提高一个产品的用户评分,改变大家对这个产品的印象呢?本文作者给大家介绍了三个概念:用户体验地图、峰终定律和服务蓝图,并详细解释了该如何使用这三...

2020-06-16
对工具型产品易学习与易使用的思考

对工具型产品易学习与易使用的思考

小编推荐:易学习是指怎么让新用户的学习成本降低,能够很快地掌握产品的使用,它的前提是足够简单和容易理解。而易使用是指,如何让用户快速、高效地完成一项任务,达...

2020-06-16
比对象还懂你!推荐算法为啥这么准?

比对象还懂你!推荐算法为啥这么准?

信息过度和广告过多的社会中,推荐算法的使用也就显得理所当然,但是它是如何做到了解用户的呢?本文从用户画像的定义和设计出发,结合实际案例,深入浅出地阐述了基于...

2020-06-15
B端平台产品需要培养的4种意识

B端平台产品需要培养的4种意识

对于许多刚入行不久的产品经理来说,B端平台产品是比较有难度的一项工作。本文作者基于自己的工作经历,提出了四点关于B端平台产品需要培养的4种意识,希望对你有帮助。...

2020-06-15
广告系列:保留价

广告系列:保留价

在一次拍卖中如果所有买家的报价均小于卖家的估价时,则拍卖品不出售由卖家保留,此时卖家的估价就是保留价,也叫底价,全称市场保留价。对于卖家来说,保留价的设置保...

2020-06-15