OpenAI CEO资助的全民基本收入实验揭秘

发表时间: 2024-08-17 21:30

如果有人每月无条件给你发放1000美元现金,你会怎么花,这会对你的生活产生怎样的影响?是会让你更努力地工作,还是会让你更想躺平了?你可能还没有考虑过这个问题,但已经有人给出了实验结果。实验结果看似科学严谨,然而却存在着巨大的方法论缺陷,本文将为你揭开这层看似科学的外衣,探讨数据背后的真相。

一、全民基本收入UBI

山姆·奥特曼(Sam Altman)是OpenAI联合创始人兼首席执行官,作为顶级人工智能公司的领导者,他相信“人工智能将消除无数人类工作”,“计算机将有效取代所有制造业”。同时他认为,解决这一问题的办法是向每个人发放基本收入,也就是全民基本收入,Universal Basic Income(UBI)。

所谓全民基本收入(UBI),是一种社会保障制度,其所宣称的目的或初衷是通过政府给每个人发钱,保证每个人都能获得满足基本生活需求的资金,减少贫困并增加人们的经济安全感,使人们可以更自由地选择工作、教育或创业,而不必仅仅是为了生存而工作。

UBI有几个关键特点:其一,普遍性,不分年龄、性别、职业或收入水平,所有人都能收到;其二,无条件,不需要申请或证明需要,每个人都会自动收到这笔钱;其三,定期支付,提供稳定的收入来源;其四,现金支付,接收者可以自由决定如何使用这笔钱。

UBI的概念很受美国硅谷科技人员的追捧,除了奥特曼,网景(Netscape)的联合创始人马克·安德森(Marc Andreessen),Facebook的创始人兼CEO马克·扎克伯格(Mark Zuckerberg),还有比尔·盖茨(Bill Gates)都是UBI的明确支持者。他们有一个共同的特点,都是技术上的大牛,同时认为人工智能和自动化会造成人类失业问题,而UBI就是解决之道。

埃隆·马斯克(Elon Musk)此前也多次公开表示对UBI的支持,他认为随着自动化程度的提高,UBI是确保人们基本生活需求的必要措施。但马斯克的看法已经开始改变,“我们不会有全民基本收入,我们将有全民高收入”。很明显,马斯克态度背后的逻辑已经发生了变化。

UBI的理念看上去很美好,但也并非没有反对的声音,比如高福利会养懒人的问题,提供无条件的基本收入,有的人可能就会不太愿意工作或完全不工作。再比如成本问题,如果为全民提供基本收入,那么将需要巨额的财政支出,这可能导致政府需要增加税收,或者以通胀的形式筹措资金。

而UBI的支持者则认为,尽管存在潜在的挑战和问题,但UBI为所有人提供了一个基本的经济安全网,帮助他们应对失业、疾病或其他不可预见的经济困难。通过提供无条件的现金支持,UBI是减少经济贫困和不平等的最佳解决方案之一,特别是对于最贫困和最脆弱的群体。

他们还认为,UBI可以增加消费者的购买力,从而刺激经济增长和需求。特别是,随着自动化和人工智能的发展,许多工作可能会被机器取代,UBI可以作为一种适应劳动市场变化的手段,可以鼓励人们选择更符合他们兴趣和技能的工作,而不是仅仅为了收入而工作,从而提高劳动市场的灵活性和效率。

支持和反对,两种声音听上去都有道理,各有利弊。而OpenAI的CEO奥特曼,也很想知道这个问题的确切答案,所以作为“一个有钱的理科生”,他决定发挥他的这两个优势,花钱来做大规模实验研究。

奥特曼出资数千万美元,来资助非营利性机构OpenResearch的实验项目,系统研究UBI的实际效果。而这项实验的目的,就是试图回答他的一个乌托邦式的问题:如果世界上的每个人都能定期、不带任何附加条件地得到一定数额的金钱,结果会怎样?

二、UBI的实验和结果怎么样?

OpenResearch的这项实验名为“无条件收入的开放研究”(Open Research Unconditional Income Study ,ORUS),它是一个大规模随机对照实验,从2020年11月开始,到2023年10月结束,历时三年。

在这三年里,1000名被试组的个人每个月收到1000美元,而2000名对照组的个人每个月收到50美元,仅这两项支出就达到了4032万美元,所以这是迄今为止全球金额最大的一次关于UBI理念的实验。

OpenResearch的研究人员,在伊利诺伊州和得克萨斯州的18个县(counties)招募符合要求的人,这些县包括大型城市(如芝加哥、达拉斯和沃斯堡)、中等规模城市、郊区和农村地区。参加实验的人员年龄须在21至40岁之间,且家庭收入不超过联邦贫困线的3倍,才有资格参加这项研究。

他们先是发邮件或广告,招募人员说是邀请他们参与一个每月提供“50美元或更多”无条件现金援助的试点项目。然后他们从报名人员中筛选出3000名符合条件的参与者,再从这3000人中随机挑选1000人,给他们每人每月1000美元,而剩下的2000人则会每人每月只收到50美元。每月领50美元的人,并不知道还有人每月可以领1000美元,所以他们就成为了被试组的对照组来进行对比观察。

在整个实验过程中,研究人员通过电话和在线调查、访谈和时间日记以及教育记录和信用报告等第三方来源收集数据。他们还从自愿的参与者身上抽血,以跟踪某些健康生物标志物的变化。他们的分析完成后,便隐去参与者的身份并公开实验数据。

现在,这项长达三年的实验终于给出了初步结果,并以论文的形式发表在美国国家经济研究局(NBER)的网站上。先是在7月份发表了一篇“保障性收入对就业的影响:来自两个美国州的实验证据” (The Employment Effects of a Guaranteed Income: Experimental Evidence from Two U.S. States),然后又在8月份发表了一篇“无条件现金转移支付对消费和家庭资产负债表的影响:来自两个美国州的实验证据”(The Impact of Unconditional Cash Transfers on Consumption and Household Balance Sheets: Experimental Evidence from Two US States)。

第一篇研究论文的主要结论集中在,无条件现金转移支付对低收入个体就业的影响。首先,无条件的现金转移支付减少了工作时间和劳动收入。每月收到1000美元的被试组,每周工作时间减少了1.3-1.4个小时,他们在劳动力市场的参与度下降了2个百分点,也就是更不愿意去工作了。

同时,他们的年度总收入人均下降了大约1500美元。这个数据换算过来就是,被试者每收到的一美元,家庭总收入(不包括转移支付)至少会下降21美分,而个人总收入则至少下降了12美分。这个对收入和劳动小时数影响的估计值,相对于对照组平均值大约下降了4%-5%。

工作时间减少了,省下来的时间主要做什么呢?调查显示,主要是休闲。另外,用于交通和财务管理、创业活动和医疗健康管理上的时间也有增加,但幅度较小。但是用在儿童照护、锻炼、找工作或者自我提升上的时间几乎没有变化。这些原本是UBI支持者期望出现的,很遗憾并没有。

其次在就业质量上,按照实验者的预期,无条件现金转移支付后,参与者虽然可能会经历更长的失业期,但可以让人拥有更多选择自由去寻找更好的工作岗位,改善工作生活质量。然而,研究人员并没有发现这种无条件现金转移支付对就业质量有什么实质性影响,甚至可以排除小幅改善。

在创业方面,无条件现金转移支付实验确实带来了影响。研究者从两个维度对此进行了讨论,一是承担更多财务风险的意愿,二是未来五年是否希望开办企业。接受了无条件现金转移支付的被试组,在这两个维度上都比对照组展现出了更多的创业企图和意愿,尽管在统计上并不显著。

不过需要注意的是,被试者表达的仅仅是意愿和企图,实际上并没有显著地转化成为创业行动。也就是说,UBI理念支持者所期望的,能让人们更自由探索提升劳动质量的效应,在这个实验中也没有体现出来。

第二篇论文则主要探讨了无条件现金转移支付,对消费、家庭资产负债表和金融结果的影响。研究发现,无条件现金转移支付显著提高了家庭的月度支出,平均每月增加至少300美元,尤其在食品、租金和交通等基本生活费用上的支出增加最为显著。尽管家庭的金融资产有所增加,但增加的资产主要体现在银行账户余额上,而这些增加的资产价值几乎被更高的债务所抵消,导致净资产几乎没有什么变化。

此外,无条件现金转移支付在短期内提高了家庭的金融健康和信用评分,但并未对信用额度、逾期还款、破产或丧失抵押品赎回权等产生影响。无条件现金转移支付还增加了家庭的流动性,使他们能够搬到不同的住房单位和社区。研究还发现,尽管短期内消费和金融健康状况有所改善,但这些正面影响并没有转化为长期的财务状况的持续改善,特别是在年轻、低收入家庭中。

简单来说,无条件现金转移支付可能是一种有效的短期工具,虽然无条件现金转移支付可以短期内增加消费和改善金融健康,但可能不会对低收入家庭的长期财务状况产生实质性改善。政策制定者如果希望增加财富或改善长期财务结果,可能需要考虑更永久性的转移支付计划或其他政策选项。

两篇论文还从其他方面进行了分析,这里不再一一介绍。相比这些结论,我更看重的是其背后的分析方法。

三、经济学上的“测不准原理”

量子力学中有一个著名的“海森堡不确定性原理”(Heisenberg Uncertainty Principle),它是量子力学的基石之一,是由德国物理学家维尔纳·海森堡(Werner Heisenberg)于1927年提出。

“海森堡不确定性原理”通常也被称为“测不准原理”,它说的是:在量子尺度上,我们无法同时精确地知道一个粒子的位置和动量。换句话说,如果我们非常精确地知道一个粒子的位置,那么我们就无法精确地知道它的动量,反之亦然。

“测不准原理”的核心在于,测量行为本身会干扰粒子的状态。在量子世界中,测量一个粒子的位置或动量需要使用光子或其他粒子,这些测量工具会与被测量的粒子相互作用,从而改变粒子的状态。这种相互作用是不可避免的,因此我们无法同时获得粒子的位置和动量的精确值。

举例来说,想象你有一只非常小的猫,你想知道它在哪里(位置)以及它跑得有多快(动量)。如果你想得到它的精确位置,你就需要尽量靠近它。但在这个过程中,你可能会不小心惊扰到小猫,导致它跑掉,进而影响你测量的准确性。

“测不准原理”揭示了量子粒子的一个经典特性,粒子的状态不是预先确定的,而是与测量行为有关,会被测量行为所影响。这种不确定性是量子力学的一个基本特征,它与我们在日常生活中观察到的宏观现象有很大不同。

实际上,在经济学中也有类似的“测不准原理”。这并不是说,在经济数据收集过程中,由于各种原因导致的数据不准确。而是说,有很多问题在逻辑上无法跨越,是逻辑本身导致的“测不准”,而不是统计数据的误差所导致的。

比如社会科学中普遍存在的“观察者效应”,当一个系统被观察或测量时,观察者的行为或存在可能改变该系统的特性,而最终可能导致数据收集和分析的结果偏离实际情况。其中原因不难理解,当被观察者意识到自己被观察,可能会改变其自然行为。而观察者对被观察者的行为或表现给予反馈,这种反馈也可能影响被观察者的未来行为。

所有的实验经济学都必然要面对这样一个问题,当被试的参与者知道自己在被观察时,他们可能会改变他们的决策过程和结果。而这种观察者带来的影响,在实验经济学的设计中,实际上是无法被消除的。另外,观察者可能会选择性地关注某些特征或行为,忽略其他信息,导致数据偏差。

在OpenResearch的研究中,使用的就是这种设计实验然后观察被试者行为的方法,这其实是行为经济学的研究方法。很明显,这种研究方法,不可避免地会存在“观察者效应”,而且无法消除。实际上,在心理学的研究上,早就发现了“霍桑效应”(Hawthorne Effect)。它揭示了当个体意识到自己成为被观察或研究的对象时,可能会改变自身行为或表现的倾向。

“霍桑效应”得名于1920年代末至1930年代初,心理学家在美国西屋电气公司霍桑市的工厂进行了霍桑实验,本来是想看看如何能提高工人的生产效率。实验中,他们考虑了薪酬、照明、休息时间等等变量,但后来发现尽管改善了这些条件,效果也并不显著。后来才发现,工人提高效率仅仅是因为他们觉得自己被围观了,因此特别有干劲。他们知道自己被观察,这种被关注的感觉可能提高了工作动力,使他们更加努力工作。

后来,“霍桑效应”在社会和行为科学中有着广泛的应用。在教育领域,教师的期望可能会影响学生的学习成绩,这就是所谓的“教师期望效应”。在医疗领域,患者可能会因为感觉自己受到医生的关注而报告更好的健康状况。在工作场所,员工可能会因为感觉自己的工作受到管理层的重视而提高工作表现。

“霍桑效应”的心理学意义我们不做过多关注,但它在经济学上的意义却值得深思。那就是,当人们意识到自己成为了一个被观察的对象时,他们所表现出来的行动与没有被观察时,哪个更真实?这中间的差距会有多大?

实际上,这是一个无法计算的问题,因为逻辑上我们不可能设计一个不去观察的实验,也无法不通过收集被试者的信息来得到实验结果。正如我们在OpenResearch的论文中所看到的,他们需要收集被试者的各种信息,甚至连采血都用上了,这怎么可能不对被试者产生干扰,带来“观察者效应”呢?

但另一方面,这并不是一个难以回答的问题。我们很多人在学生时期都做过一些问卷调查。很多人都会有类似的想法和做法,在涉及到一些偏向负面的选项时,即便是该选项符合自己的身体心理状况,我们也会故意不选。原因不难解释,我们潜意识中都不希望别人窥探自己,即便有些问卷调查是匿名的。如果不得不向别人展示自己,那就尽量展示自己更光鲜的一面,而悄悄隐藏一些自己知道的缺点。

所以,如果让我来评价OpenResearch的研究成果,尽管它们耗时耗力耗钱,花了三年时间几千万美元来做研究,但他们在研究方法上就存在着根本的缺陷和不足。无论被试者所呈现出的结果如何,他们的数据都是已经被“观察者效应”所“污染”了的。这些结果,对于被试者而言,既不是真实的自己,对他人也毫无借鉴意义可言。

四、逻辑问题而不是实验问题

OpenAI的CEO奥特曼是一个有情怀的人,他曾多次表示,全民基本收入是贫困问题的有效解决办法。他是一个行动派,他在2019年创立了世界币(Worldcoin),声称将创造一种“集体拥有的全球货币,将公平地分配给尽可能多的人。”但是这家公司和这个币,都远未达到预期目标。即便奥特曼本人目前是全球最强大的人工智能公司领导者,也没有让世界币获得成功。

奥特曼的情怀值得肯定,但他忽略了最重要的一点,那就是,人不是物,人和物是不一样的。对物理学等自然科学的研究方法,并不能照搬运用到人的行动研究上。包括行为经济学和OpenResearch在内的很多研究方法,简单地把对照实验那套自然科学的研究方法挪用过来,结论看上去有理有据,但实际上却是差之毫厘失之千里。

除了前面说的“观察者效应”之外,以人作为研究对象的社会科学,也做不到实验设计所必需的“隔离条件”。比如OpenResearch的研究中,要考察的是无条件发钱给人们这一行为带来的变化。理论上,只有其他条件不变,只考察这1000美元所带来的变化,才能真实反映行为变化和发钱之间的因果关系。

但现实中完全做不到,因为人们的决策可能受到很多因素的影响,每月1000美元的意外中奖在人的行为决策中到底占多大比重,则完全无法计算和衡量。所以OpenResearch的研究,充其量只能是在用数据描述发钱前后的变化,却无法在逻辑上建立有效的因果关系。

再者,科学研究追求的是普遍必然性,然而现实中千人千面,每个人都是有自由意志的行动个体。3000名被试者的表现都各不相同,那么如何从这仅有的实验结果,来推断其他人面临类似情况时的选择决策呢?理论上做不到,现实中也没有人能够做到。逻辑上决定了,OpenResearch的研究只能是一个历史数据的集合,对未来没有任何指导意义。

奥特曼没有注意到的是,关于全民基本收入UBI的问题,其实更多的是逻辑问题,而不是实验问题。比如成本问题,如果这项工作完全是由私人资助,那么这不过是一种慈善行为,无可厚非。但是UBI的很多支持者,他们的诉求是,希望政府可以推进全民基本收入的政策实施。这种诉求就不再是私人慈善行为,而是需要巨额的财政支出,而这势必会导致税收的进一步增加或者财政赤字的进一步扩大。

再比如这背后涉及的伦理问题,如果是私人出资做慈善,这当然没有问题。但如果用税收和财政资金来实现UBI的理念,相当于是拿别人的钱去做慈善,同时需要建立庞大的行政机构来负责发放和管理,这个过程本身恐怕就有争议。

UBI如果真的实施,必然会导致人们过度依赖政府福利,失去自我激励和自我的价值认可,进而导致社会分裂,加剧人们对贫富差距和不平等的错误认识。正如计算机科学家、虚拟现实专家杰伦·拉尼尔(Jaron Lanier)所指出的,“人们不会(对发钱的举动)说‘你真好’,他们会说,‘我恨你,因为你在告诉我说,人们需要你而不需要我,我的生计依赖于你的慷慨。’”

五、OpenResearch的底层认识论缺陷

最后我认为有必要进一步指出的是,OpenResearch的研究方法背后,还隐藏着一个重大的认识论缺陷。无论是山姆·奥特曼、OpenResearch的研究人员,还是使用类似实验方法进行研究的行为经济学家们,都没有对这个缺陷引起足够的重视。

在OpenResearch和行为经济学类似的研究中,他们没有在论文中写明,但却都默认了一个前提假设,那就是,他们认为人和人之间是可以用某个或某些常数进行关联的。也就是说,他们必须预设的前提是,通过实验结果得出的因果结论,也适用于其他那些没有参加实验的人。

因为他们的实验目的很明确,就是期望用实验数据找到某种因果关系,并利用这种因果关系来影响政策或制度的走向。所以,他们默认的前提预设,必然是实验数据和结论在不同人之间是通用的。否则,如果没有这层预设的考虑,他们的实验将变得毫无意义。

遗憾的是,这种隐藏的预设,仅仅在自然科学中成立。自然科学中有一些常见的常数,比如真空中的光速c,量子力学的基本常数普朗克常数h,中学化学就会学到的阿伏伽德罗常数,以及万有引力常数G等等。这些常数有固定的数值和单位,是我们理解自然现象和进行科学实验的基础。

但是在经济学以及任何社会科学中,我们找不到哪怕一个这样的常数。翻开任何一本经济学教科书,都不会告诉你存在一个与人或社会有关的常数,为什么?因为在人的行动中,本身就不存在自然科学中那样的常数。

哲学家大卫·休谟(David Hume)讲过一个著名的小故事:“有一个主人养了一只鸡,他总是在喂鸡之前摇一下铃铛。时间一长,鸡自然而然就把“铃铛”和“开饭”联系起来,只要听到铃铛一响,就会冲过来准备就餐。但是直到有一天,主人来了一个朋友,他计划杀鸡来款待朋友,这个时候他又摇起了那个铃铛……”

休谟故事中的那只小鸡,每当听到铃铛响就知道是要开饭了。它看上去好像建立一个固定的因果关系,形成了一个“常数”关系。但是当小鸡的主人有一天改变了主意,这个“常数”瞬间失效。类似的,我们可能在统计学上知道一个人过去一年每天早晨都跑步,但我们无法据此就可以推断他明天早晨一定还会去跑步。

不同的环境、不同的条件,我们都可能会有不同的判断。比如逛商场看同一件衣服,我们前一秒很喜欢,而后一秒买下了就很有可能后悔。或者反过来,还是那件衣服,导购员没有讲解的时候我们不喜欢,导购员解说一番我们又变得喜欢了。再比如有的人看直播的时候本来没想买东西,结果一不小心就被主播“套路”了。

面对同一件事,我们在不同的时间也可能会有着完全相反的判断。也就是说,人有自由意志,人的自由意志决定了,我们无法像研究物理学那样,找到关于人的一种“恒常关系”。这也是奥地利学派经济学家米塞斯(Ludwig von Mises)所强调的:“在人的行动领域,不存在经验的因果常量。”

如果你能够理解这一点,你就会发现OpenResearch的研究,不过是粗略地模仿物理学的研究方法,试图通过实验数据,在人们的经济行动中建立起某种因果关系,并且默认这种因果关系也适用于那些未曾参与实验的人。很显然,他们这种默认的预设是错误的,所有的实验和结果都是建立在错误的认识论和方法论上的“空中楼阁”,毫无根基可言。

• (本文仅为作者个人观点,不代表本报立场)

张是之

责编 陈斌