几年前,我一有极度不爽的修车经历,就会去点评网站Yelp上给那家修理厂打个低分。不过随着好评不断涌入,那条差评很快就从首页上消失了。这让我对所谓的“口碑经济”或“打分经济”开始产生怀疑。
接下来的几年,各种打分网站如雨后春笋般涌现。从心理医生,到使用打车软件的乘客,每个人和每件事现在都成了可以打分的对象。正如《纽约时报》专栏作家陶曼玲使用幽默的笔触所写的那样,当她很难打上车时,Uber乘客如今也在被司机们品头论足。
无所不在的打分究竟是好事还是坏事?带着这个问题,我深入研究了“打分界”,并且很快发现了所谓“口碑经济”的很多问题。以下就是我的发现。
打分很重要
事实上,打分和声誉的确非常重要,大多数人和企业都意识到了这一点。正是出于这一原因,Reputation.com(原名叫Reputation Defender)的创始人迈克尔•弗迪克才能开创出一门庞大的生意。据《卫报》报道,这家成立于2006年的公司“迄今已经帮助160万个付费客户展示其线上声誉…搜索引擎显示的结果都是其最讨人喜欢的经历。”无论是真实的还是带有部分“加工”成分,声誉关系到一个人的职业前景,或创业公司的融资能力。而人们的社会地位又会影响其婚烟前景和事业伙伴。
另外,打分也深刻地影响着消费者的选择。一份针对1000余人的调查显示,三分之二的受访者会阅读网上的评价,然后90%的人表示,他们的购买决定会受到正面评价的影响,86%的人表示负面评价也会影响他们的选择。一些学术文献也认可消费者打分的重要性。一篇论文指出:“事实显示,消费者的评论能够用来预测购买决策……推动消费者进一步评价……比专家评价的影响力还要大。”此外,该论文还指出:“销量数据是随同产品评价增长的,而不是基于产品质量。”
消费者的打分准确吗?
消费者打分的强大影响力引发了一个问题:这些评分既然能够有力地影响人们的判断和决策,那么它们究竟有多准确呢?答案是,这要看你怎么定义“准确”。
在以下三个例子中,有的打分对选择供应商很重要,有的则不那么重要;同时它们用来衡量表现的客观标准也不一样。
医生
就医时能获得最好的治疗非常重要。治疗结果通常来说是直观的,比如病情好转的程度,治疗不当引发其他病症的几率等,由此我们以为消费者能非常准确地评价医疗服务的质量,但实则不然。
Consumer’s Checkbook是一个采用会员订阅制的机构,主要在旧金山等几座大城市运营。除了要求消费者对初级护理医师进行评分外,Checkbook还对大量执业医师进行了调查,以确定各个专科的最佳医师提名。该机构不接受任何广告,同时它也有自己的医生质量排名。
2014年,在病人评出的104名最高评级的初级护理医师中,只有17人被他们的同行提名为最佳人选。另外在患者评出的最高评级的医生中,只有60%被Checkbook评为最高级。
教师
然后是无所不在的教师评分,尤其是对大学教授的评分。几十年来,高等教育机构一直把对学生的问卷调查成绩作为衡量教职员工工作表现的一部分,现在大多数教育机构都要求课程结束后收集学生的评价。如果你也像我一样,相信教师的本职工作是教书,好让学生能学到并记住知识,而不是给学生讲段子、称兄道弟,那么你在衡量学生的评分时就要睁大眼睛,要根据客观衡量标准看看学生究竟学到了什么,然后再看看它与教师评分之间的关系,你才知道学生的打分是否准确。
好在给教师打分的做法已经实施了很多年,对于学生评分与学生成绩之间的关系也有大量的研究。不过坏消息是,学生的课程评价,几乎与客观标准反映的学生学习成果没有任何关系——人们了解这个事实已经40多年了。比如,一篇发表于1972年的论文研究了293名正在学习微积分课程的在校大学生,结果发现:“学生主观评分最低的教员,获得了最高的客观得分。”不过,尽管学生评分对他们的学习成果没有任何有价值的参考意义,但这还是没有影响评分在教育机构中的普遍使用。
餐馆
和找医生找老师相比,对餐馆质量和用餐体验的打分往往会客观一些,引起的后果也更少。米其林公司从1926年起,便聘请知识渊博、经验丰富的匿名专家,到全球各大城市寻找最好的用餐地点。我们可以在TripAdvisor等网站上,将米其林的评级方式与一般老百姓的评分方式进行对比。
我选择了两座城市,一座是离我住的地方很近的旧金山,另一座是我和我妻子最近刚去过的巴塞罗那。我在2015年的米其林榜单上找到了这两座城市所有获得米其林星的餐厅,然后看了它们在TripAdvisor上的评分。以下是我的发现:
巴塞罗那有21家一星或两星的米其林餐厅。按理说,这些应该是这座城市里最好的餐厅,但其中却只有一家登上了TripAdvisor的前10名,只有两家进入了前50名,只有7家进入了前100名。其中一家名叫Nectari的餐厅拥有一颗米其林星,但它在TripAdvisor上仅排在第2262名;另一家名叫Enoteca的米其林星级餐厅仅排在第1333名。
旧金山的食客兼打分员们对米其林的尊重也只是多了一点点。在旧金山的24家米其林星级餐厅中,只有一家名叫Gary Danko的餐厅在TripAdvisor上排名前10,但有6家米其林星级餐厅挤进了TripAdvisor的前50名。但作为整个旧金湾区仅有的4家二星级米其林餐厅之一的Coi,在TripAdvisor上的排名却仅为第562名。
至少对于这三个领域,可能还有许多其它领域来说,消费者的评分往往与专家意见或客观的衡量标准是不相关的。当然,正因如此,许多声誉管理公司才会做得这样成功,因为声誉是可以“管理”的(你可以从最好和最差的意义上理解这个词汇),而与实际的质量无关。
为什么评分会鼓励错误的行为
由于评分及其产生的口碑会产生经济后果,人们自然就会获得足够大的激励去操控这套体系。一种越来越普遍的方式就是雇佣“水军”来发布虚假评价(或是开发软件,不过软件是比较容易探测和预防的)。据一份研究预测,在Yelp上,有16%餐厅评价是虚假的。虚假评论往往更趋于极端,口碑较差的餐厅通常更倾向于请“水军”。IT研究机构高德纳公司2012年的一份研究估算称,有15%的网络评价都是虚假的。2013年,纽约州检察长“与19家企业达成一致,后者同意停止撰写不实评价。”
数不清的网站时不时都会冒出招聘水军的帖子(然后这些帖子又消失了),让他们写自己的好话,或是写竞争对手的坏话。消费者网购前应该充分获得各方面的评价信息,以做出明智的购买决定。保障这些评价的真实性在经济上具有重要意义。因此,亚马逊和Yelp都在积极构建各种算法以筛除不实评价,同时也在针对虚假评价的发布者采取法律行动。
斯坦福大学MBA毕业生、OwnerListens公司的联合创始人阿迪•比坦告诉我,目前企业主要采取了两种类型的策略:“白帽”和“黑帽”。“白帽”战略一般会先找到最满意的顾客,然后鼓励他们在热门网站上撰写评价。“黑帽”战略即给竞争对手甚至是潜在的竞争对手写差评、扣帽子。比如有人在Yelp上只给了芝加哥名厨格拉罕姆•艾略特的三明治和冰淇淋店1星评价,那人还说,当他走到那家店时发现它关门了,结果毁掉了“他原本惬意的散步心情”。但事实上,当时根本还没有到那家店的营业时间。艾略特举这个例子来说明差评究竟可以没有下限到什么程度。他对Yelp的评价用词基本上不适合发表。
除了虚假和不实评分以外,口碑经济还有其它更多的问题。为了吸引顾客的评价,企业有时会采取没有任何用处,甚至有害的方法来“刷好评”。
再次以教师的评分为例。大家都知道这样一个潜规则:教师要想获得更高评分,其中一种方法,便是给有评分权的学生更高的分数。正是由于“要好评”心理的作祟,这种现象已经成了高校的流行病,同时使考试成绩越发失去了学生学习成果和能力衡量指标的意义。我们不知道更高的考试成绩是否一定会带来更高的教师评分,但单单是这种心态本身就会影响教师的行为。
这种行为无非是一种互惠主义的体现——我帮了你(比如给你一个好成绩),然后你再帮我(比如给我一个比较高的评分)。反正人类天生就有与人为善的习性,大家也不愿意被别人当成一个难说话或者讨厌的人。这让人不禁去想,就像教师与学生、打车软件的司机与乘客之间的互惠关系一样,如果交易双方都可以给对方打分,会是什么样子。
科技媒体TechCrunch的一篇文章指出,eBay在2008年通过评价体系改革消除了买卖双方相互评价的可能。文章还指出,同样一套房子在Airbnb(该网站允许相互评价)上的评分要比在TripAdvisor上高出14%(不允许相互评价)。该文章指出:“在不匿名的社会环境中,人们都想在别人眼里留下好印象,不愿意说别人的坏话,因为谁都不想让别人觉得自己是个老是在抱怨的人,或老是在唠唠叨叨。”阿迪•比坦也指出Uber上司机的得分都太高了,他认为这也是互利评价的缘故,因为你只有给别人一个极为正面的评价,别人才会投桃报李给你一个正面的评价。
除此之外,“口碑经济”还有可能导致更加严重的问题。比如医生为了获得病人的好评,经常会给病人做一些不必要的诊断测试,或是给病人开抗生素或强效止痛药,特别是当病人主动要求的时候,而不管病人需不需要,有没有用。也就是说,评分或对评分的预期改变了医生的治疗方法。“在南卡罗莱纳医疗协会2012年的一项调查中,半数受访医生表示,由于面临着需要提高患者满意度的压力,很多医生不当地为病人开了抗生素或麻醉剂。”患者评分的流行与滥用麻醉剂之间是否存在某种关系,也是个值得观察的问题。
有办法解决这个问题吗?
虚假评价,特别是那些比较极端和简单的虚假评价,是可以通过统计方法检测出来的,只是目前技术还不完美。经济学家布莱恩•雅各布茨和史蒂芬•列维在一篇著名的论文中指出:“出乎意料的测试成绩波动和可疑的答案模式”,可以用来检测教师是否为了提高学生的分数而弄虚作假。正如我上文指出的那样,Yelp、亚马逊和谷歌等网络公司都在努力消除虚假评价,比如通过构建算法筛查出可疑行为等。
亚马逊采取了验证网购评价者身份等策略,从而提高了水军发布虚假信息的成本和难度。
企业招聘新人和考核绩效(这两件事的本质也是评估)时的做法提供了另一种有效的解决方案,即标准化的产品或服务评价指标。米其林和普通食客对同一家餐厅的评价之所以非常悬殊,是因为米其林的员工有一套更加正规的评价标准,以及一套确保这些标准能被严格遵循的流程。
比坦的公司旨在帮助各种类型的企业获得实时的顾客反馈,先发制人地解决服务问题,阻止负面评价。比坦为我们提出了两条建议。她指出,如果人们不能匿名发虚假信息的话,他们就不大愿意那样做了,所以身份验证可能是个有用的办法。另外,由于很多明显的原因,你的朋友和熟人提供的信息一般比陌生人更加有用和可信。不过在这个问题上,“也有些数据显示,在北美,大多数人更相信网上的评论,而不是他们的朋友。”这真不是一个好习惯。
当然,我们也不要只看最近的评价,或是最显眼的网络搜索结果。大多数人都是懒人,看东西只看摘要和最近的评论,而那正是各种声誉管理公司最爱朝我们下手的地方。在好评的大海里淹没几条差评是最简单的事,这当然也是看商家有没有请声誉管理公司的最简单的方法。你也可以看看最正面或最负面的评价是否大多采用了类似的语言(也可以编个程序检测一下),这种方法虽然不完美,但也有可能检测出这些评价是否虚假,或经过了一番“管理”。
最后,如果社会资本真的像钱一样,阻止伪造就将变得越来越重要。同样像制贩假钞一样,阻止伪造虚假评价与想方设法“制造”或“管理”评价之间的角力也在日益升级。随着评分的经济影响越来越大,造假的诱惑也会呈指数级增长。
口碑经济的美妙世界远远谈不上美妙,甚至离诚信也有很远的距离。因此,你最好尽可能地相信那些不偏不倚的专家意见,只要你能找得到它们。其实在很多领域,这些专家意见都不难找到,只是有时你可能得付钱。很多报纸也刊登最佳餐厅的排行榜,另外很多机构,包括《消费者报告》和Checkbook都在提供各种产品和服务的公正评价。
当然,专家的节操也是可以买卖的,不过比起大多数“水军”,甚或那些为了利润而“管理”声誉的企业来说,专家顾及其社会地位,会更加患得患失一些。不要让简单的总结评分欺骗了你,而不去花充足的时间去芜存真。即便是在口碑经济中,“谨防上当”仍然是一条颠扑不破的真理。