文献:Phillips, J., Ong, D. C., Surtees, A. D. R., Xin, Y., Williams, S., Saxe, R., & Frank, M. C. (2015). A Second Look at Automatic Theory of Mind. Psychological Science, 26(9), 1353–1367. https://doi.org/10.1177/0956797614558717
研究背景: ¶
心理理论( Theory of Mind,ToM )是表征其他行动者不可观测的心理状态,并用于解释或预测其行为和经历的能力。这种能力是人类社会交往的许多方面的核心,包括合作、道德判断、共同关注、学习以及我们相互交流的能力(Hare & Tomasello, 2004; Young, Cushman, Hauser & Saxe, 2007; Grice, 1989)。在ToM研究中,表征他人错误信念的能力被广泛认为是测量ToM 的试金石(Bennett, 1978; Dennett, 1978;Pylyshyn, 1978)。
其中一个关键的理论问题是ToM背后的心理计算的本质是什么?有两种观点:
1,ToM是中枢认知的一部分,是深思熟虑的、缓慢的和努力的(Keysar, Lin & Barr, 2003);
2,ToM是一个自动化、快速和轻松的模块化子系统(Baron-Cohen, 1989;Cohen & German, 2009;Wertz & German, 2007)。
鉴于对这两种观点的证据支持,一个关键的问题是,成年人是自动地代表他人的精神状态,还是只是经过深思熟虑的努力。需要更多的证据来提供足够严格的测试,以确定成年人是否自动地代表其他代理人的信念,即使这些信念与任务无关或在任务中提及。
Kovács, Téglás和Endress (2010;以下简称KTE)旨在提供这样一种测试。在KTE报告的实验中,成年人判断球是否存在的时间似乎受到另一个代理人对球是否存在的信念的影响,尽管代理人的信念与任务无关。KTE利用这一证据证明,人类成年人会自动跟踪其他行为者的错误信念,并将这种反应模式与学龄前婴儿在类似任务中的错误信念表征的相关示范联系起来。虽然这一发现对ToM研究至关重要,但作者认为,采用KTE范式的研究不应该被用来解释这一争论。本文稳健地重复了KTE在成人(研究1a ~ 1c)中支持信念表征自动性的关键效应,但也表明这种效应来自于用于确保参与者依从性的“注意检查”范式。
本研究 ¶
在亚马逊土耳其机器人(Amazon Mechanical Turk)上在线自主完成,平均耗时20-25分钟。
预测:
在原始论文中,KTE预测:如果参与者自动编码代理的信念,并且如果代理的信念影响对球存在的反应时间,那么当代理认为球存在时,参与者对球的反应应该比代理认为球不存在时更快(图2第二栏)。
本研究的两个进一步预测:
1.如果参与者被要求对没有球做出反应,而不是对有球做出反应,那么我们应该看到反应时间模式的逆转(图2第三栏)。为了说明这个预测:当注意到球不在时,最快的反应时间应该出现在参与者和代理人都认为球不在并且它不在的情况下(P-A-)。
2.如果智能体的视角被遮挡(如,在智能体和球之间始终放置一个永久性遮挡物),那么智能体不应该形成关于球位置的信念,因此不应该影响球呈现试验的响应时间(图2;最右)。
综上共三个预测。在研究1a-1c试图复制KTE的第一个预测的证据;在研究2-3中直接检验了第二个预测;在研究4中直接检验了第三个预测。
方法: ¶
材料与设计: ¶
study1a-1c均为KTE实验1的直接重复:
研究1a (N=60;),研究1b (N=80;)使用Amazon Mechanical Turk在线上进行(随后的所有线上实验也使用相同的人群进行)。研究1c (N=24;)在实验室进行的:参与者是成年人(17名女性,年龄18-26岁,平均20.6岁)在麻省理工学院安静、黑暗的房间里进行测试。
study2a、2b:
研究2a (N=80;排除18例)在线进行。研究2b (N=24;在实验室中进行)。
这两项研究与研究1a-1c的不同之处在于:参与者要在球出现时按下一个按钮,如果球不在则按下另一个按钮(CR实验)。这种操作能够测量对有球和无球试验的反应。如果反应时间反映了自动ToM,使得参与者自动编码代理信念的内容,那么当agent认为球不存在时,参与者对球不存在的反应应该也能得到促进。
study3:
N=100,排除14例,在线进行;参与者只在球不在的情况下做出反应,而在球在的情况下则不做出反应(absent实验)。换句话说,它需要与研究1a-1c完全相反的反应标准,这为Study 1a-1c提供了一个更具体的对照。
study4:
N=80,排除23例,在线进行。和研究1a-1b的唯一不同是增加了一个一直存在的遮挡器,以完全阻挡代理人对球的视线。这项研究测试了反应时间是否对代理人所能看到的东西敏感:如果参与者隐式地跟踪代理人的信念,那么这个遮挡物的存在,阻碍了代理人的观点,应该消除代理人的信念造成的影响。
刺激:使用KTE中的描述创建视频刺激集。几乎与KTE的相同,本研究的视频时间略长,但包含基本相同的时间特征。图1列出了用于在线研究的刺激的截图,以及每种刺激类型的重要时间。
排除标准: ¶
在注意检查或检测反应期间,不准确的反应试验被放弃。如果参与者在所有试验中注意检查和检测反应的准确率均达不到90%,则被排除在外。如,在研究1a中有40个试验,每个试验都有一个注意力检查反应和一个“球在”反应(如果球不在则无反应)。因此,每个参与者有80个回答。如果其中一个或两个反应都不正确,试验就会被取消(例如,如果一个参与者错过了注意力检查,但对球的反应是正确的,试验仍然被取消)。如果参与者在所有试验中回答正确的次数少于72次(90%),则被排除在外。对于没有注意检查的研究,仍维持90%的检测反应标准。这种相对高度的排除规则确保了线上收集的数据来自于认真关注任务的参与者,从而与实验室收集的数据具有可比性。
样本量: ¶
对于实验室研究,收集与KTE相同数量的参与者(N=24)。对于线上研究,计划收集比原始样本大2.5倍的样本(N=60)。最终,研究1a,为了在应用排除规则之后有足够的功率,收集了N=80的样本量。研究3收集了N=100的样本。
统计方法: ¶
对于初始复制研究(研究1a-1c),作者遵循了KTE使用的统计方法,其中使用单独的t检验对不同条件进行两两比较。
因为交叉交互作用描述了四个测量值之间的关系,量化这种交叉相互作用以汇总后续研究中的信息,为此采用了以下方法:使用R中的lme4包拟合线性混合效应模型,结构为rt ~ participant.belief * agent.belief + (participant.belief * agent.belief | subject)(该模型使用“最大”随机效应结构;Barr, Levy, Scheepers & ty, 2013)。然后,我们使用交叉相互作用效应的可靠性作为观察到我们在最初的重复研究中所做的相同交叉模式的检验。完整的模型、数据和分析代码可以在https://github.com/langcog/KTE上找到。
结果: ¶
一,重复了KTE(2010)的关键统计结果。 ¶
表1报告了KTE的t检验以及研究1a-1c的等效检验。感兴趣的有四个主要比较:
1.与P-A-相比,P+A+时参与者更快地发现球。
2.当P+A-时,与P-A时相比,参与者的速度也更快。
前两次比较证实了预期的结果,即参与者的信念对参与者的反应时间有影响。
3.复制了KTE解释为自动ToM提供证据的关键结果:,与P-A-相比,P-A+时参与者的反应更快。
4.重复了空结果,即参与者的反应时间在只有代理人相信球存在的情况下和只有参与者相信球存在的情况下没有差异。KTE认为两种类型的信念(参与者信念和代理信念)各自对反应时间的促进程度相同。
总之,KTE报告的所有统计检验在所有三项研究中都得到了重复。
二,观察到与KTE理论不一致的交叉相互作用: ¶
所有三个实验都显示出强烈的交叉相互作用(研究1a-1c,图3顶部)。
交叉是由P+A+试验中相对较慢的反应时间引起的。如果反应时间反映了自动ToM,那么当agent正确地认为球在那里时,参与者对球的反应应该比agent认为球不在那里时更快,但这里观察到相反的模式(P+A+比P+A-慢)。这种交叉作用与自动ToM不一致,并且在KTE报告的数据中没有观察到(图1)。这种交叉作用在本研究所有的三个重复实验中(以及随后的研究中)都存在。因此,尽管一致地重复了KTE报告的所有统计测试,但本文的数据与他们的理论不一致。
三,无论行为人对球是否存在的信念如何,交叉交互作用都会被观察到。 ¶
研究结果如图3所示,相较于P-A-条件,参与者对球不在的反应在P-A+时更快,与预测相反。且不同条件下对球不存在的反应时间的交叉模式与对球存在的反应时间的交叉模式完全相同(图3)。
研究者进一步对研究1-3进行分析,分析模型包括参与者和代理人信念,以及试验是否为CR/absent试验(以及所有相互作用),测试了CR和“absent”试验是否产生了与原始“present”试验不同的反应时间模式:
在不同的反应标准(回答“在场”或“缺席”)下,反应时间的模式没有统计学差异。这一结果显然与自动ToM解释的预测相矛盾。
此外,在每个个体实验中观察到的参与者和代理信念之间的仍存在可靠的双向交互作用。
四,交叉交互与代理的视角无关。 ¶
在study4中,agent对球的位置没有感知,反应时间应该只受参与者自己的信念的影响。结果显示:不同条件下的反应时间模式与之前的实验相似,这与预测相反,且交叉相互作用仍然是可靠的。
未完……