联系我们

chucr@ahswan.com

热线电话

86-0556-2173435

网络公司为什么热衷于大数据杀熟?

  互联网公司热衷于大数据杀熟,利用用户个人数据制定个性化定价策略,但这样的做法可能侵犯用户隐私。

  2.同济大学管理科学与工程学院老师胡一竑表示,动态定价和大数据杀熟不同,前者是不同的人买同样的东西价格不相同,后者是基于大数据的个性化定价。

  3.胡一竑通过博弈论模型发现,平台佣金率在20%左右时,大数据杀熟现象最严重,可能会引起消费者剩余和社会福利最低。

  4.为防止大数据杀熟,监管者需要介入,要求平台在收集、使用消费者信息前获得消费者允许,并控制信息买卖。

  5.胡一竑建议,将权力还给消费者,让他们自己来做是否允许平台收集个人隐私信息的决定,以保护消费者权益。

  关于大数据杀熟的讨论不是第一次了,然而,2024年年末,关于“年轻人反向驯化大数据”的话题又一次成为了热点。然而,亦有人指出,伪装、哭穷式的“反向驯化”开始时也许会有点效果,在愈加聪明的算法面前,最终,所有这些终将会被归入大数据,作为商家用来推测消费者意图的参数之一。在这个算法的世界,作为普通消费者,究竟该如何自处?我们这个日渐数字化的社会,怎么样才可以避免大数据的滥用?

  同济大学管理科学与工程学院老师胡一竑解释道:个性化定价本来是市场营销领域的一个经典题目,对于不同的人给予不同定价以获取较高利润本是商业世界中稀松平常的手段,然而,“大数据杀熟”的问题就在于这些定价的基础来自于大量用户的个人数据,这一些数据是否该算作用户的资产,滥用这些个人数据,甚至将其打包售卖给第三方商家,是否合适?这些都有待法律和法规加以明晰。

  2024年2月,在管理学顶刊《生产与运营管理学会会刊》(POMS)上,胡一竑和博士研究生渠胜男等发表了共同合著的论文《在线平台上的信息共享和个性化定价》(Information Sharing and Personalized Pricing in Online Platforms)。在这篇经历了三年与审稿人的沟通、修改才得以面世的论文中,胡一竑他们用一个博弈论模型刻画了在线平台上的三方:平台、第三方商家与消费者三方的各种选择。在他们的模型中,决定商家是否选择大数据杀熟的一个重要的条件是:平台佣金。在佣金适当的时期,存在一个平台自营与第三方商家都倾向于不适用大数据进行个性化定价的状态,然而,随着平台佣金率的提升和新用户的减少,基于大数据的个性化定价开始介入,并在最后导致一个“消费者剩余和社会福利最低”的状态,科技让生活更糟糕了。要防止这样的一种情况发生,便需要监管者介入,甚至,研究者粗略估算出了第三方商家对大数据从不使用到使用之间的佣金阈值——20%。

  这个阈值究竟如何得出?国内平台目前的大数据定价现状如何?全球对这样的一种情况又有着怎样的应对经验?

  胡:大数据杀熟的本质其实是个性化定价,这是市场营销和运营管理领域的一个经典题目,经济学里也会讲这样的一个问题。过去,企业可能做价格歧视,它的的本质就是看人下菜碟。这种歧视,在过去的表现形式比如:把优惠券寄到你家里,也就是给你一个折扣。这种形式有两种做法——一种是对经常光顾的老客户就多给一点折扣,不经常来就给少一点;另一种则是反过来,如果你是新客户,就多给你优惠,老客户反而无所谓,反正你也经常来了。

  (后一种有点对熟客歧视的味道),我知道大家很难接受这一点都是从道德层面,感觉好像(熟客)被辜负了。但实际上,管理学中,从企业的角度来看,这件事情特别合理,是非常理性的决策,因为这群老客户已经认定我们的产品了,他们是忠诚用户,所以不需要再给额外的优惠和刺激了。对企业来讲,给熟客优惠不是利润最大化的选择,所以,从企业来看这种决策很正常,不值得谴责。但我们觉得,比较值得谴责的一点是:在做个性化决策的“大数据杀熟”时,是要使用到用户个人信息的,这一些信息有可能关系着用户的隐私,这就涉及到隐私保护问题。商家有没有权利用这类信息(进行杀熟),甚至是不是能够把信息再卖给别人,让别人再来做大数据杀熟。

  在经典经济学中,传统的个性化定价,客户信息比较简陋,比如:商家会看到某个客户经常来店里购物,这个人是男是女,是老是少,这一些信息都是相对公开的。但是平台有一定的概率会把购买与用户的信用卡挂钩,地址、消费的频率、网页浏览行为……这一些信息平台都掌握了,只不过看它用不用。此时,如果基于这一些信息再对用户进行数据杀熟,用户就明显处于非常不利的地位了。所以,在法律层面这会存在很大问题。从管理学角度来看,信息实际上也是一种资产,若使用用户的信息再对他进行杀熟,是不是侵犯了用户的资产?这里也会有争议。至于(商家)使用优惠券或是其他方式来达到利润最大化,我们觉得很合理的,不值得谴责,但如果这涉及到用户的隐私信息,基于这一些信息来发放优惠券,情况就变得不一样了。

  我们做那篇论文时也看了很多法律方面的论文,确实,在(大数据杀熟)领域的讨论很多,但执行起来特别困难,因为,这样的一种情况通常都特别隐蔽,都是算法做的,自动的,不需要人工控制,归责的时候也很难说清。

  我们能想象,杀熟很多,个性化定价很多,但找证据非常难,不会有企业承认自己在做这类事情的。他们会说:我们只是在做动态定价。但是,个性化定价和动态定价是不同的,前者是不同的人买同样的东西,会出现不同的价格,而后者,是价格随库存或者受欢迎程度而变动,比如电影院还有多少座位物,火车上有多少个座位,甚至变动最大的,机票还有多少席位,这都是跟着时间变化,依据市场的需求变化来制定价格的。如果知识动态定价,不同的人在同样的情景下看到的价格应该是一样的。

  平台在进行个性化定价的时候,往往很喜欢针对一些非常容易做动态定价的商品去进行个性化。对某些东西,比如大米,价格基本是固定的,很难做个性化定价,也非常容易被看出来,但另外一些商品,比如飞机票,因为行业里默认的是可以做动态定价,本来就忽上忽下的,一直在变,如果偷偷地加上个性化定价,可能就不太容易被发现了。甚至当你拿这个证据去跟相关平台对峙,平台还可以辩解说我是正常的动态定价,因为动态定价在理论上来讲是没问题的,过了半小时、1小时,市场上需求又变了,根据供需关系调整价格完全是可接受的。

  《知识分子》:您是怎么想到来研究这样的一个问题的?这样的一个问题是学术界的热门话题吗,做起来最大的困难是什么?

  胡:个性化定价这样的一个问题过去就是经典的题目,只不过现在有了平台,个性化定价的方式更加的隐蔽,更加智能化,所以,近两年很多人都在研究个性化定价在平台上是怎么做的?但研究起来,很大的问题是,如何去证明平台采取了基于大数据的个性化定价?

  我们这个文章投稿的时候,评审给我的意见里就有这样的一个问题:有没有证据说明这件事是真实发生的?这当时就把我难倒了,因为我们只有一些零星的新闻报道,但是企业是不会承认的,这很奇怪,大家都知道(这件事情在发生),但没证据。所以我当时找了很多资料去回复,我们文章写了一年多,后面陆陆续续补充资料,用了3年的时间才让评审相信这件事情是真实发生的。

  其实除了我这个文章之外,另外也有人在研究这类题目,甚至我们的题目国内和国外也有人同时在做了,但他们可能结果不是很好,所以没有发表出来。今年10月份有一个欧洲的老师发邮件过来,说他写了基本上跟我一样的题目,但因为我这个已经发表出来了,他就被好杂志们拒绝了。所以,其实(管理学)学术界对平台上的“大数据杀熟”性质的个性化定价还是挺关心的,因为确实现实中这类现象其实很严重,理论上也有很多值得研究的地方,因为这种电子商务平台是之前没有的,所以之前的理论都没有涉及过,这是个新鲜的东西,大家其实都还是很有兴趣的。

  《知识分子》:审稿人要求您出示证据来说明确实发生过这个情况,您觉得您给出的证据里面特别有力的证据是什么?

  胡:我们论文中提到了国内一家电商公司的一个JDM服务市场的平台,就有一个明码标价的用户画像服务,这个画像是可以被用来进行个性化定价的,然后我们有很多新闻媒体报道的证据也提交给了审稿人。

  另外,美国商务部在2016年有一个关于个性化定价的报告,这个报告里谈到了他们目前的现状,平台怎样解决,美国政府该怎么做等等。商务部发布的报告是官方报告,也证明了在美国肯定存在这样的现象,所以才需要讨论。

  另外,亚马逊上有一个化妆品公司,他们在新闻媒体上提到过,使用了大数据算法设计优惠券,设计好之后对方利润就提高了多少。

  因为一般电子商务平台有了大数据以后肯定会做一下个性化,其区别只是粗糙还是细致。粗糙一点比如,区分一下老客户、新客户。我自己用了两个账号登录一些购物平台去查,用我爸爸的账号看衣服跟用我自己的账号上去确实给了不同的优惠券。我购买的时候,价值会高一点,没什么券,我爸因为是新客户,或者是老年人,对价格相对较敏感,就给了一个券,额度还不小,大概有几十块钱,我当时就截图直接发给了审稿人。个人会使用的很多证据虽然没有像法律标准上要求的那样规范,但综合起来也可以证明情况了,不然我们的论文也没法发表。

  《知识分子》:你们最开始也是进一步探索了国内这一些平台在这方面做的情况,包括您在论文中使用了JDM服务市场的图片,你们是怎么拿到这么多东西的?

  胡:那是一个公开的平台,任何一个人都可以去看的,只不过这样的平台一般消费者不太会去看。

  我们当时想调查各大平台基于大数据个性化定价的情况,然后就搜到了这个服务平台,里面是这家电商企业来提供给它的第三方卖家的各种服务,这些服务都是收费项目,比如推广告,把商品推上首页,我们截图的这一个项目是作为增值服务存在的,也就是客户画像。如果第三方卖家想把自己的店铺做好,那就可以买一些数据来做自己的消费者画像,根据消费者画像,就可以做一些定制服务,比如:发放一些优惠券。有时候,有些人打开页面会跳出满100送多少的券,这有很大的可能性就是个性化定价的,根据你的情况跳出来,它不是大家都有的。我们当时做了很多工作搜出来这样的一种情况,然后发现这应该是证据之一,它收费,它作为一种增值服务存在,不是免费给第三方卖家的,而且,最重要的是,它能够适用于个性化定价。

  亚马逊那边就比较难搜到(这类的服务),因为亚马逊在2000年时出过一个丑闻,上面卖的 DVD,被发现对老客户收了很高的价,对新客户的价格就很低,BBC 当时对此事进行了题为《亚马逊老顾客被“杀熟”》的报道。出了那个新闻之后,亚马逊马上就撤掉(这个公开的服务项目),那之后,他们就不太敢光明正大地做这类事情了,他们现在对外说他们做的是动态定价,不做个性化定价,不做大数据杀熟,但我们仍旧是在某些行业报告里面查到了,他们应该还是在做,只不过没有过去那么容易被查到了而已。

  胡:我们建立了一个模型,底层逻辑是用不用个性化定价是两方博弈的结果。两方,指的是平台和第三方卖家,平台收入的大多数来自是平台自营的利润和第三方卖家缴纳的佣金。这是现在做电子商务平台研究普遍会用到的一个框架,我们在上面又叠加了信息竞争,平台拥有信息,用这个信息可以对自营产品做个性化定价,它还可以把信息卖给第三方卖家,就像卖广告一样,靠卖信息来赚取一部分利润。当平台把信息卖给第三方卖家之后,第三方卖家可以基于这一些信息进行个性化定价,进而增加自己的利润,从而覆盖向平台购买信息所支付的成本,毕竟,大家都不会做亏本的事情。

  我们分了四种情况,第一种是平台自营和第三方都不用个性化定价;第二种是平台用信息给自己的自营产品做个性化定价,但第三方不用;第三种是平台把信息卖给第三方,让第三方进行个性化定价,但自己不用;最后一种当然就是平台和第三方都使用个性化定价。

  这里,你要考虑第三方要不要买信息,因为第三方卖家也会考虑,买信息对自己有没有好处,买信息后去做个性化定价能够提升多少利润,如果费用太高那就不划算了,所以这个模型有点复杂,在产品竞争的基础上又叠加了一层信息买卖,这个信息又可拿来做大数据杀熟,获取更多的利润。但我们最后的结果是比较有趣的,跟大家的直觉有点相反,最后出来的结果是中间有一块居然是双方都不用信息的时候,利润最大化。

  我简单来讲讲这个结果,跟这个结果相关的几个因素,一是新客户的数量,新客户多,那就说明数据不够,另一个是佣金,也就是提成比例,这个数值很重要,我们的计算发现,当佣金的数值较低的时候,不管是自营还是第三方卖家,都倾向于不使用大数据来做个性化定价。

  这相当于提成的比例很低的时候,其实政府不用太担心,他们互相自由竞争、基于自己的利润最大化决策之后,有很大的可能性是大家都不用信息。在提成比较低的时候,还有两个可能性,一种可能性是平台自己用,卖家不用,另一种是卖家用,平台不用,这个情况对消费的人的伤害还比较小,因为有选择,消费者可以去选不用大数据的那一家,所以危害还比较少。

  所以,新旧用户的比例比较适中,平台对信息的掌握没那么极端,平台对消费的人的了解也比较正常,双方如果理性思考了,觉得还不如不用(大数据驱动的个性化定价),这样的一种情况是有可能发生的。虽然现实可能不像模型那么理性,因为模型里我们会假设参与方都特别聪明、特别理性,但现实中我相信这种(大家都不用大数据的)情况是有的。主要的原因是个性化定价的成本很高,有算法、服务器、懂得规划算法的人来做系统,如果只是小业务的卖家,他们其实付不起这个成本的。

  但随着是提成比例(佣金)升高,情况就开始危险了,尤其当佣金上升到某些特定的程度,平台的最佳选择可能就变成了自己不用信息,不再卖自营商品,(放弃通过自营商品赚取利润了),彻底地把信信息卖给第三方卖家,退出市场了。这时,相当于市场被第三方卖家垄断了,所以整个情况就会从竞争变成了垄断,然后平台就能够最终靠操纵信息得到很大的利润,提成也很高。而垄断以后,再使用个性化定价,消费者受到的伤害是非常大的。因为消费者别无选择,他们的那些剩余价值就都被拿走了,这个情况很危险。

  《知识分子》:佣金是独立于出售信息的价格的,对吧?按照您的模型,佣金达到一个什么样的阈值之后,大数据杀熟的情况会恶化?

  胡:我们的计算中信息费是第三方与平台谈判得到的一个固定的价格,这个数值与佣金有关,但更多地看第三方和平台博弈的一个结果。我们有个计算的方法,总的来说就是:平台就会观察一下,看看在给定佣金率和其他参数的时候,第三方会愿意付多少钱来购买信息,这个值会随着其他参数发生明显的变化。但是我们得知,最重要的仍然是要看佣金,所以最终,决定平台和商家决策的重要的因素仍然是佣金。

  当佣金比较低的时候,比如平台提成5%-10%,一切都还算合理,但随着这个数值升高,(按照我们的模型),情况就变得不一样了,大约佣金升到20%左右的时候,平台和第三方就有利用大数据达到高利润的动机了,整个市场就不再是公平竞争了,监管也就该介入了。

  目前国内的话,据我们的了解,比如某电商公司,据我们不难发现,大概佣金率在百分之十几的样子,不同品类会不一样,但还未达到20%警戒线。我们应该警惕的是,全球来看,确实也有佣金很高的情况,比如亚马逊在推的一个项目——Amazon Exclusive program,就是承诺让商家独占市场。他们跟商家签合同时,会承诺亚马逊平台本身不卖你的商品品类,也不会再引入其他第三方,但提成非常高,虽然这个佣金很高,但因为独占市场,对商家还是很着迷的。这种情况就很危险,大数据杀熟,以及其他的一些对消费的人非常不利的情况就都来了。我觉得这其实是自由竞争跟垄断的区别,这是很明显的问题。

  目前大部分的大数据杀熟,或者叫个性化定价还比较隐蔽,监管很难真正监管到,从技术上来讲,很难。所以,我们就建议:要警惕比较高的提成,因为,比较高的提成可能就会有很危险的垄断情况的出现。整体上,如果市场是自由竞争的,其实不太用担心,因为,很可能他们双方都不用(个性化定价)。但一旦佣金超过了20%的警戒线,可能情况就不一样了。

  佣金过高,其实是平台利用它的垄断地位来收获利润,而第三方商家付出了这些佣金、信息费,他们肯定也需要更高的超额利润,最后这些成本,都加到了消费者身上。所以,在一个大数据肆意杀熟的市场中,平台和卖家可能都是受益方,所有的超额利润都来自消费者。

  胡:现在有很多文章在讨论要限制平台收集、使用消费者信息的能力,欧盟推出了《通用数据保护条例》(GDPR),在使用消费者的信息之前,要先得到消费者的允许。所有的平台,欧洲、美国都要遵守,我不知道国内有没有在做,但国内某一家公司出海时因为这个条例也被罚款了。(注:指的是2021年7月,中国企业字节跳动旗下海外短视频平台TikTok,因违反GDPR第12条被荷兰数据保护局以侵犯儿童隐私为由罚款75万欧元。荷兰数据保护局认为,TikTok仅向荷兰儿童提供了英文版的隐私声明,没提供荷兰语版的隐私声明,但英文隐私声明对荷兰儿童来说并不属于易读懂的内容,因此认定TikTok违反了GDPR的规定。)估计以后中国可能也要走这条路,毕竟,GDPR政策现在国外做得很好。

  中国目前的情况相当于消费者的信息被平台无偿的随意的使用,且消费者未被告知,这是目前所有争议的来源。GDPR的政策是,平台要使用用户的信息就会跳出来一个窗口,问你允不允许把你的数据授权给平台让他来用,如果消费者说不允许,就不能用。是否共享数据,应该是一个主动的让顾客挑选的选项。我们为此特意翻看了好多国内平台的隐私政策,它们大多默认你是允许的,你如果要不允许,就要打开(这个界面),找很久之后,选中不允许才行。需要用户自己查找界面这一点是不对的,相当于平台把那个选项藏起来了。

  中国还有一个很麻烦的事情,有些平台,他们既是社交平台,同时又在做社交电商,你能够尝试一下,这种平台,你关闭它们收集你个人隐私信息的功能,你的社交、娱乐体验会下降很多。那么是不是我们为了这些体验就愿意把我们信息给平台了呢?这相当于平台要给消费者多少好处,消费者会愿意让平台收集自己的信息呢?这样的一个问题的关键还是要把权力还给消费者,让他们自己来做这个决定。

  总的来讲,对企业来讲,它们肯定要追求利润最大化,不可能让企业自动去考虑社会公平,所以肯定需要管理者发布有关政策向他们提出要求,起一定的调节作用。但政策何时出,怎么出,能不能起到作用,我们可能就一定要通过模型去研究。

和为贵 智为上 信为本 勤为力

Harmony is precious, wisdom is supreme, faith is the foundation, diligence is strength.