与类人代理相比,非类人代理的自发心理理论被弱化



文献:Bardi, L., Desmet, C., & Brass, M. (2019). Spontaneous Theory of Mind is reduced for nonhuman-like agents as compared to human-like agents. Psychological Research-psychologische Forschung, 83(7), 1571–1580. https://doi.org/10.1007/s00426-018-1000-0

论文原文

研究表明,与非生物因素相比,生物因素的联合作用效应更强(Tsai & Brass, 2007),在观察人类时,凝视暗示效应比观察机器人时更强。 基于自下而上的特征或自上而下的影响,我们越认为一个代理像人类一样,这个另一个代理的行为就越会影响我们自己的行为。随之而来一个问题问题出现了,我们是否自发地代表不同的人的信念,特别是非人类的agent,这些agent是否直接影响我们自己的行为?在测量他人心理状态对我们自身行为影响的自发ToM任务中,已经报道了在使用蓝精灵和巴斯光年(《玩具总动员》电影中的人物)作为代理的自发ToM任务中对他人信念的表征(Kovács et al., 2010;Nijhof, Brass, Bardi, Wiersema, 2016;Bardi, Desmet, Nijhof, Wiersema, Brass, 2017a)。我们很可能将漫画人物拟人化而将他们视为人类。所以这仍然是一个悬而未决的问题,我们是否自发地代表了我们认为是人类或与我们相似的行为者的信念,或者我们也代表了我们认为是非人类的行为者的信念。 为了处理这个问题,本研究使用自发Tom任务的改编版本(最初由Kovács等人开发。),并提供一个明显不同于人类的agent。具体如下:

参与者31名参与者(6名男性)参加了这项实验,其中14名参与者养狗。

参照Kovács等人的蓝精灵ToM任务,但agent为一只狗。实验提供了4个真实信念视频(P−A−B−、P−A−B+、P+A+B−和P+A+B+)和4个错误信念视频(P−A+B−、P−A+B+、P+A−B−、P+A−B+),参见图1。每个视频片段在整个实验过程中重复5次,共40次实验。在实验开始之前,参与者完成了四次有反馈的练习。要求参与者专心观看视频片段,如果他们在视频片段的末尾检测到一个球,则用他们的右手食指(键盘上的B键)按下右响应按钮。为了确保参与者专心,他们还必须在agent离开现场时按下按钮。这里需要按左键(键盘的V键)。

图1

首先,研究者通过比较参与者预测球不存在P−[(P−A−)+ (P−A+)/2]和参与者预测球存在P+ [(P+A−)+ (P+A+)/2]的情况来测试现实偏差是否存在。结果显示显著的现实偏差,t(28) = 3.8, p = 0.001, p−条件下的检测时间大于p +条件下的检测时间(p−条件:M=381, SD=82, p +条件:M=352, SD= 80)。这个结果证实了参与者对球的存在做出了预测,而这些预测会影响他们的表现。 其次,测试了狗的信念是否影响参与者的表现,以及信念表征是否受到养狗的影响。重复测量方差分析计算检测时间与因素信念(P−A−vs. P−A+)和变量所有权(狗主人vs.无主人)之间。因子Belief不显著,F(1,27)=1.42, p=0.24, η2 p=0.05,说明反应时间不受狗的信念的影响(p−A−:M=387, SD=92, p−A+: M=374, SD=84)。养狗与否无显著主效应,F(1,27)=2.73, p=0.11, η2 p=0.09。此外,信念和养狗之间没有显著的交互作用,F(1,27)=0.81, p=0.38, η2 p=0.03,表明两组的p−A−和p−A+条件之间没有差异,养狗和不养狗的人都表现出不显著的ToM指数(见图2)。

图2

以上的结果表明,虽然参与者在执行任务时考虑了自己的期望,但狗的信念并不影响他们的检测时间。其次,养狗和不养狗的参与者在ToM指数上没有差异。人们不会自发地考虑狗的信念,但这个结论可能为时过早,因为它是基于一个无效的发现。为此进行了第二个实验。

在这个实验中,向一组新的参与者提供了两个不同的自发ToM任务。其中一个任务在实验1中使用的任务相同,并将狗作为代理。另一项任务以巴斯光年为agent。 如果实验1的结论是正确的,应该在Buzz光年任务中得到显著的ToM指数,而在狗任务中没有显著的ToM指数。

41名参与者(8名男性)参加了本实验。

试验次数是上次试验的两倍。每个任务(一个以狗为代理,另一个以巴斯光年为代理)都有80次试验,其余的设计与实验1中使用的设计相同。两个任务的顺序在参与者之间是平衡的。参与者以几分钟的休息时间相继完成这两项任务。

如同实验一,首先测试了参与者对球的存在的预测是否会影响他们的检测时间。在检测时间上,对任务(狗vs. Buzz)、参与者(P−vs. P+)和顺序(狗任务优先vs. Buzz任务优先)等因素进行重复测量方差分析。观察到参与者的主要效应(现实偏差),表明参与者认为球不在时比认为球在时慢,F(1,38)=27.55, p<0.001, η2 p=0.42 (p−条件:M= 771, SD= 106, p +条件:M=734, SD=93)。任务不存在主效应,参与者与任务之间无显著交互作用,F(1,38)=2.73, p=0.11, η2 p=0.07。探索性简单比较证实,狗t(39)=4.03, p=0.006 (12 ms)和Buzz t(39)=4.03, p= 0.001 (26 ms)存在显著的现实偏差。命令和任务之间存在显著的交互作用,显示简单练习效应F(1,38)=5.16, p=0.029, η2 p=0.12。首先完成狗任务的参与者在狗任务中比在Buzz任务中慢,而从Buzz任务开始的参与者则相反。

其次,为了检验代理人的信念对参与者表现的影响,数据通过重复测量方差分析与因素任务(狗与Buzz),信念(P−a−vs P−a +)和顺序(狗任务第一vs Buzz任务第一)进行分析。结果发现信念的显著主效应,F(1,38)=13.39, p=0.001, η2 =0.26,表明当代理人认为球会出现时,参与者的反应比代理人认为球不会出现时更快。 根据假设,观察到任务与信念的显著交互作用,F(1,38)=7.23, p=0.01, η2 p=0.16。事后t检验显示,P−A−和P−A+条件(即ToM指数)在Buzz任务中差异显著,t(39)=4.49, p<0.001 (P−A−:M= 405, SD= 71, P−A+: M= 369, SD= 54),但在狗任务中差异不显著,t<1 (P−A−:M=386, SD=68, P−A+: M=380, SD=58)。命令和任务之间存在显著的交互作用,显示简单练习效应F(1,38)=7.25, p=0.01, η2 p=0.16。首先完成狗任务的参与者在狗任务中比在Buzz任务中慢,而从Buzz任务开始的参与者则相反。Task, F<1的主效应不显著。见图3。

图3

实验1和实验2的结果表明我们没有考虑狗的信念,因此可以说当面对不像人类的智能体(如狗)时,自发的信念表征是不存在的。

那么是否有可能引入一种操纵,诱导狗的自发信念表征。关于模仿的研究表明,对特定代理的关注量可以增强模仿过程(Heyes, 2011)。最近的研究也表明,在一个内隐的视角采取任务中,将参与者的注意力引导到代理的位置会增加代理的视角对绩效的影响(Bokowski, Hietanen, Samson, 2015)。这里使用两个操作来增加对非人类代理的关注。首先,在实验开始之前,让参与者在电脑上和狗狗玩一个互动的球类游戏。通过这种方式增加代理和参与者之间的联系/熟悉度,从而增加参与者对狗的关注。第二,狗的项圈上色。这个领子可以是蓝色的,也可以是红色的,偶尔受试者会被问到在之前的试验中领子是什么颜色的。这样,他们应该把注意力更多地集中在每个视频片段中的狗身上。如果注意确实改变了信念的自发表征,结果应该在这第三个实验中获得显著的ToM指数。

42名参与者(24名女性)参与了这项实验。

与实验2中的任务相比,有两个不同之处。首先,视频片段中的狗戴着彩色项圈。这个项圈可以是蓝色的(50%的短片中如此)或红色的(50%)。其次,为了确保参与者注意代理,还在20%的试验中随机插入了同样的问题:“狗有蓝领吗?”,在电影片段结束后出现。问题以黑色文字在浅灰色背景上呈现1000毫秒。“是”和“否”分别出现在屏幕的左边或右边。50%的问题左边是“是”,右边是“否”,反之亦然。这样避免了事先计划应对措施。参与者必须用左手中指(键“W”)回答左边的答案,用左手食指(键“X”)回答右边的答案。 在参与者开始自发的ToM任务之前,他们和狗玩了一个互动的球类游戏。参与者被告知,他们稍后必须执行一个视觉检测任务,但他们首先要和狗玩一个小游戏。在这个球类游戏中,参与者看到(并听到)一只狗在叫,前面放着一个球。参与者被告知,当狗叫时,他们可以按空格键把球扔出去。当参与者按下空格键时,球滚开,狗抓住球并把它带回给参与者。这样重复了五次。

与前两个实验一样分析了现实偏差和ToM指数。观察到积极的现实偏差,t(39) = 2.42, p = 0.02,表明参与者预期球不在时比预期球在时慢(p−条件:M= 770, SD= 116, p +条件:M=741, SD=111)。 有趣的是,P−A−条件与P−A+条件(ToM指数)比较具有显著性,t(39)=2.05, P =0.047。与其他实验相比,在这里观察到狗的信念影响了参与者的检测时间。更具体地说,当狗相信球会出现在封堵器后面时,与代理人和参与者都不期望球出现时相比,反应更快(P−A−:M=390, SD=60;P−A+: M=379, SD=60)(图3)。虽然具有显著性,但需要注意的是,与实验2中使用Buzz获得的效果相比,该效应仍然明显较小,t(78)=8.04, P =0.009。

我们似乎并不代表我们周围所有主体的信念。当观察一个不同的人,比如狗,这个主体的信念不会影响我们的行为。由于两个原因,这一无效发现不能归因于任务缺乏敏感性。首先,在所有的实验中都重复了现实偏见:当参与者认为球不存在时,他们检测球的速度要比他们认为球存在时慢。这重复了先前的发现,表明任务对参与者的期望很敏感。第二,当巴斯光年作为agent出现时观察到ToM指数显著。也就是说,与Buzz认为球存在的情况相比,当Buzz认为球不存在时,参与者检测到球的速度要慢一些。 本研究中,当我们观察到一个具有类似人类的物理特征并因此被视为人类的非人类代理时,我们代表了这个代理的信念。而当我们观察到一个与我们明显不同的非人类主体时,这个非人类主体的信念不会被自发地考虑进去,或者至少在较小程度上考虑进去。所以,agent的物理特性可能是决定他人的信念是否以及在多大程度上影响我们在自发ToM任务中的表现的关键因素。未来的研究应该通过研究决定信念表示边界的特定属性来扩展目前的结果。

视频剪辑中使用的狗是一只保护犬(杜宾犬),通常被认为是相当具有攻击性的。因此,可能是参与者对这只狗有消极的感觉,因此,不代表狗的信仰。研究表明,在捕捉内隐视觉视角的视角摄取范式中,焦虑会增加自我中心主义,减少替代中心主义。因此,参与者没有追踪狗的信念是合理的,因为狗是杜宾狗这一事实产生了焦虑。此外,狗有嗅觉,使它们能够根据气味追踪看不见的物体。也就是说,狗从来没有错误的信念,这可以解释零发现。这一观察结果要求通过采用不同的非人类样物质来复制先前的结果。

信仰表征是否真的可以用二分法来表达:要么我们代表别人的信仰,要么我们不代表别人的信仰,或者它是逐渐调节的。注意力可以使ToM效应出现的事实表明,后者可能是正确的。研究者将三个实验的数据结合起来,以获得一个更大的样本(N=109),并看看是否会获得具有该样本的狗的显著ToM指数。使用任务因子(exp. 1,2,3)作为主体间因子,信念因子(P−D - vs P−D+)作为主体内因子,进行了重复测量方差分析。结果显示主效应显著,信度F(1106)=4.15, p=0.03,效应量较小,η2 p=0.04。任务和信念之间没有相互作用。

本研究表明我们不能自发地代表所有其他主体的信念。非人类代理人(如狗)的信念不会对我们的行为产生强烈影响。且agent的经验(养狗与否)不足以表示该代理的信念。当注意力被吸引到视频片段中的狗时,狗的信念显著影响了参与者的表现。此外,当将三个实验的数据结合起来以获得更大的样本时观察到狗也有显著的ToM效应,这表明我们是否代表对方的信念并不是一个二分法。需要更多的研究,使用不同种类的代理和不同的任务来证实和扩展我本结果。