事实如此浪漫

我们对人类A/B测试的厌恶是危险的

研究表明,人们对A/B测试有一种非理性的厌恶,这可能会限制医院、立法机构和企业等重要机构基于客观证据做出决定的程度。 摄影:Fernando Cortes / Shutterstock

Ffacebook曾与康奈尔大学的科学家合作,进行了一项臭名昭著的情绪传染实验。研究人员随机分配了70万名用户,让他们在一周的时间里,在他们的新闻源上看到积极或消极语言的轻微上升,或者根本没有变化,以确定暴露于某种情绪是否会反过来导致用户表达某种情绪。答案在2014年揭晓答案是肯定的:我们在网上看到的表达的情绪会改变我们表达的情绪,尽管是轻微的。然而,随着该研究的公开披露引发了一场激烈的讨论,有关情绪传染的对话很快被搁置了强烈反对许多人认为这是对人们感情的不公正和不诚实的操纵。Facebook后来道歉篡改用户情绪,并承诺修改内部审查惯例。

然而,我们有理由认为这种反弹并非完全合理。研究人员操纵的规模很小;用户在修改后的消息源上看到的内容与他们通常一周内看到的内容并没有太大不同。盖辛格健康系统(Geisinger Health System)的生物伦理学助理教授米歇尔·迈耶(Michelle Meyer)说,更重要的是,Facebook仅仅是推出了自己的平台,就普遍彻底改变了人们表达自我的方式,对心理健康产生了未知的影响。“但没有人说他们应该接受联邦调查,没有人因此起诉他们,没有人说他们是怪物,或者可能驱使人们自杀。她告诉我。“但只要你让人们随机看到他们无论如何都会看到的东西,在一段合理的时间内,人们就会吓坏。”

Facebook的情绪传染研究只是其中之一几个例子企业试图通过随机实验或“A/B测试”更好地了解他们的产品和服务。A/B测试是指,在实验中,受试者被随机分配到接受两种不同治疗中的一种,然后对某些结果进行比较。就像情绪传染研究一样,许多这样的实验引起了公众的强烈抗议,原因可能看起来很直观,也很明显,比如缺乏知情同意,或者认为在知情的情况下不平等对待他人是错误的。但最近一一系列的研究迈耶和她的同事对这些解释表示怀疑。他们的研究表明,人们对A/B测试有一种非理性的厌恶,这可能会限制医院、立法机构和企业等重要机构基于客观证据做出决定的程度。

在16项研究中,迈耶和她的同事随机分配5873名参与者阅读领导者决定如何最好地实现目标的短文。领导者可以在三个可能的决定中做出一个:普遍执行一个政策,普遍执行另一个政策,或者在选择一个政策之前进行A/B测试来比较两个政策。参与者被随机分配到三个可能的决定中的一个,并对其适宜性进行评价。这些小片段涵盖了广泛的主题,从自动驾驶汽车的监管到减贫,再到增加雇员退休计划的登记人数。而且,重要的是,对于每个话题,研究人员都小心地选择了两种未经测试的策略,它们的适宜性大致相同,这样两种选择都不会明显优于另一种。例如,一个小片段描述了一位医院院长通过提醒医生标准安全协议来降低感染率的努力。导演的选择是A)打印协议的医生的徽章,B)打印海报的协议被放置在医生工作的房间,或A / B)患者随机分配到治疗的医生戴着徽章或工作在一个房间里的海报,然后比较两组之间的感染。

Meyer和她的团队发现,在他们测试的几乎每一种情况下,进行A/B测试的决定被认为是最不合适的。换句话说,人们更喜欢当权者根据自己的判断普遍执行未经检验的政策,而不是先检验它们。这种所谓的“A/B效应”甚至在受过STEM教育或拥有较高科学素养的参与者中也存在。

当被要求为他们的评分进行辩解时,许多接受了A/B测试的参与者表示担心,小插图中的决策者在对他们进行测试之前从未征求过人们的同意。然而,只有不到1%的参与者提出了同意的问题,他们被分配了一个小插曲,在这个小插曲中,领导者普遍实施了一项未经检验的政策。这种不一致的同意标准令Meyer和她的同事们感到困惑,因为正如他们在文章中所写的,“在所有情况下,人们都是未经同意而接受了两种未经测试的、影响未知的政策之一。”为什么只挑出A/B测试?

根据研究人员的说法,A/B效应的一个可能原因是“代理知识错觉”,即相信别人知道的比他们实际知道的更多。参与者可能会感到不安,因为看到掌权的人承认需要进行测试——换句话说,承认他们知道的不够。“这让你感觉更安全,更舒适的在你的日常,想象你接受治疗的医院的主任是无所不知的,或者知道的去上班,或者看着你的案子特别,已经选择最好的做法是什么,”帕特里克·赫克说,他是盖辛格卫生系统的博士后研究员,也是这篇论文的合著者。“事实上,这种情况非常罕见。”

A/B测试也可能因为与科学和实验相关的文化包袱而令人反感。“从纳粹塔斯基吉人类活体解剖《弗兰肯斯坦》——顺便说一下,其中大多数都不是真正的科学实验,”迈耶说,“‘实验’和‘随机’这个词有一种通俗的用法,有非常负面的含义。”

不管原因是什么,似乎有一种对a /B测试的持续厌恶遍及广泛的人群。然而,迈耶说,放弃随机实验可以让少数人掌握更多的力量。迈耶说:“我希望生活在一个实践、政策和治疗尽可能以证据为基础的世界,而不是基于那些碰巧成为公司CEO或医院院长的人的直觉。”“有很多特质可以让人登上权力的位置,但事先神奇地知道什么有用,什么没用并不在其中。”

Meyer, Heck和他们团队的其他成员目前正致力于寻找让A/B测试更容易接受的方法。一个潜在的策略是帮助人们更加熟悉随机实验的过程和目的,从而更加适应。此外,考虑到“实验”和“随机”等词的负面含义,可以用“试验”等不同的术语来构建A/B测试。

事实和分析在公共生活中的作用似乎是萎缩因此,扩大随机实验吸引力的努力可以说从未像现在这样重要过。赫克说:“政策、政府、医疗保健以及所有这些旨在改善人们生活的高接触性系统和组织,从根本上都与科学——社会科学,尤其是基础科学联系在一起。”“当然,基础科学的主要工作是随机评估。”

考虑到这一点,我们所有人都摆脱紧张情绪,偶尔让自己成为小白鼠,这可能是明智的。

斯科特·柯尼格(Scott Koenig)是纽约市立大学神经科学专业的博士生,在那里他研究道德、情感和精神病。在推特上关注他@scotttkoenig

得到了鹦鹉螺必威开户官网

最新和最受欢迎的文章投递到您的收件箱!



加入讨论