快速逻辑?:检验双加工理论的时间进程假设



文献: Bago, B., & De Neys, W. (2017). Fast logic?: Examining the time course assumption of dual process theory. Cognition, 158, 90–109. http://dx.doi.org/10.1016/j.cognition.2016.10.014

原文

1.文章概述

1.背景和目的

人类思维的双加工模型:先进性快速、直觉、启发式的反应(type 1),再进行更慢的、深思熟虑的加工(type 2),type 2 会覆盖或者纠正type 1。

默认干预者双重处理(DI)框架中的标准假设是,自动且快速的Type 1过程首先会产生直观的启发式答案。启发式答案的生成随后可能会经过深思熟虑的第2类缓慢过程,这可能会导致对初始启发式答案进行更正。

预期的时间进程假设是,推理者将首先生成启发式答案,如果需要,将在增补反应后纠正这一点,以得出正确的逻辑响应。

已有研究都不能说明进行了type 2 加工的被试先进行了type 1加工。因此需要研究确定被试先进行了凭直觉的反应,且在初始反应阶段只进行了直觉反应,才能确定DI的时间进程假设。

总之,根据标准DI理论,原则上应该只有两种主要答案类型:第一响应不正确–第二响应不正确或第一响应不正确–第二响应正确。关键问题是,在生成正确的最终答案之前是否确实要先生成初始的错误答案,或者人们是否也可以为第一个答案生成正确的逻辑答案。后一种模式将提供直接的证据,证明存在快速、符合逻辑的1类推理。

2.实验设计

2.1 实验1:仅提示语,基线

1.被试

101人,平均年龄38.95

2.设计

  • 基本比例任务

8种基本比例问题

固定十字1000ms,呈现两组样本的名字2000ms,再呈现描述性信息2000ms,再同时呈现问题和比例。(一句一句出现,前一句不消失),知识语强调被试要尽可能快地做出反应。

在测试之前进行2个非冲突性句子的练习。测试阶段进行完第一阶段的反应后,被试对自己的反应自信程度打分(0%-100%),再次呈现句子,被试做出最终反应后,再次对自己的反应自信程度打分。

format

  • 三段论任务

8个推理问题

每个问题都包含一个主要前提(例如,“所有狗都有四只腿”),次要前提(例如,“小狗是狗”)和一个结论(例如,“小狗有四只腿”)。任务是评估结论是否依据前提逻辑得出。

过程和基本比例任务一致。初始阶段屏幕上问题和选项的颜色是绿色的,最终阶段是蓝色的,视觉上提示被试处于不同阶段;同时问题下方会出现一句提示句来提示不同阶段。

2.2 实验2:限制反应时间

104人,平均年龄39.9;52人,进行阅读预测验。

阅读预测验

被试阅读实验1中使用的任务句,计算出平均阅读时间,以确定限制时间。仅提供阅读所需时间,那么2类反应的参与就会变少。

为确保参与者被激发去实际阅读材料,我们告诉他们在研究结束时我们将向他们提出两个(对于两个任务,总共四个)非常简单的验证问题,以检查他们是否阅读了该材料

平均时间:基本比例2.92s,三段论2.62s。最终限制时间3s.

测试

和实验1相同,区别在于:引入限制时间,最小化进行2类反应的可能性。问题出现后,给被试3000ms来做出反应,2000ms后改变背景颜色提示被试立即做出反应。如果3000ms没有做出选择,会提示被试没有回答,在下一问题应更快作答。

12%的试验没有做出第一阶段的反应,这部分数据不计入总的分析。

2.3 实验3:负担

99人,平均年龄39.28

设计

进行一个并发加载任务:点记忆任务,来增加执行认知资源的负担。因为2类加工的定义特征之一是需要执行(工作记忆)资源。

增加负担以减少2类加工参与的可能性。

图1

任务和问题与实验1一致,在十字消失后,出现如图1的矩阵,指示被试记住点的位置。之后与实验1相同,出现问题,要求被试做出反应并评价自信程度。之后再次出现矩阵,让被试选择正确选项。之后再次呈现问题,被试做出最终反应并评价自信程度。

11% 的矩阵选择不正确,分析时将数据去除。

2.4实验4:限制时间+负担

115人,平均年龄38.85

和实验3用一样的负担任务,但是增加一点:在初始和最终反应阶段都有负担任务,被试在最终反应前都需要记得点记忆任务的答案。限制时间和实验2一致,3s。没能在限制时间反应及矩阵任务没能回答正确的都被去除,16.7%。

3.结果

3.1 最终反应的准确性

表1

在大多数试验​​中,人们在解决冲突问题时通常会有偏见。四个实验的平均最终准确度对于基本比例任务只有40%,对于三段论推理任务只有48%。在无冲突的问题上,1类处理能够正确回答问题,被试的基准比例任务平均最终准确率达到94%,显着提高,b = 4.77,Z = 25.06,p <0.001,进行三段逻辑推理的任务占77%,b = 1.51,Z = 17.07,p <0.001。

最终的反应精度通常与基于经典的单响应范例完成这些任务的文献所期望的相一致。

3.2 改变方向

指:在重新思考阶段,特定试验中特定人更改(或未更改)初始答案的方式或方向。

4种类型:(1)初始反应错误,更改为正确的反应,“01”;(2)初始反应错误,最终反应也错误,“00”;(3)初始反应正确,最终反应更改为错误的,“10”;(4)初始反应正确,最终反应也正确,“11”。

表2

支持DI双加工理论的2种趋势:很高的00反应概率:人们通常会倾向于遵循启发式响应,这会导致错误的第一响应,该响应随后不会得到纠正。很少的01概率:有时,最初的错误响应会在进行额外的思考后得到纠正,但是这种情况很少见。

但是,11反应概率很高,在一开始就给出了正确的反应,对标准DI模型进行了挑战。

跨实验分析发现,11概率在实验2-4时稳定了,说明最初的正确反应不是来自于2类加工。

也有一种可能是被试靠猜在一开始得出了正确答案,2个选项,50的概率。但跨实验分析,11的概率为90%和73%,且在4个实验中无显著差异。冲突的情况下显著高于非冲突,如果靠猜,应无差异。

表3

总而言之,当前变化分析方向的DI双过程理论的时程假设面临的主要挑战是'11'响应的普遍性。尽管我们观察到00响应的预测优势,但我们还发现,在大多数情况下,将正确的响应作为最终答案,该响应已被选择为初始答案。初步表明,在人们得出正确的最终反应的情况下,已经直观地生成了正确的反应。

3.2.1 稳定性指标分析

人们可能会怀疑参与者对一种或另一种变化类别的偏好是否稳定。就是说,在一个冲突问题上做出正确或不正确回答的个人是否对其他问题始终如一地做到这一点,还是人们对问题的回答偏好更易变?

如果一个人在所有四个冲突问题上都显示相同类型的变化方向,则稳定性指数将为100%。如果仅在两个试验中观察到相同的变化方向,则稳定性指数将为50%,以此类推,分别为100%, 75%, 66%, 50%,小于33%。

在所有四个实验中,绝大多数被试对至少三分之二或四分之三的冲突问题表现出完全相同的变化类型。说明变化的类型在个人层面上是高度稳定的。

3.2.2置信度等级和响应时间分析

对四种不同类型的变化方向类别的响应潜伏期和置信度进行检查,可以帮助人们进一步了解人们答案变化(或缺乏答案)背后的原因。

图4

00、11–高自信;01、10–低自信,会改变初始反应的被试对应更低的自信。

在少数情况下人们确实改变了他们的最初反应,其特征在于在最终反应阶段需要更长的反思时间。这一结果支持DI模型。

用R的nlme包分析数据,将变化方向类别(11、00、10和01)和实验条件(实验1-4)作为固定效应因子输入模型,将参与者作为随机因子输入。发现变化方向和实验条件之间存在显着的相互作用。

3.2.3 响应时间–初始响应

基本比例任务:方向改变和实验对模型匹配度(model fit)有显著主效应,无显著交互作用。

三段论任务一样。

在没有限制反应时间的情况下,视觉上识别出的更长的初始响应潜伏期趋势显著。可能是因为有10例延迟导致的,后续对比分析还确定,这种特定趋势对于三段论很显著,对比例任务不显著。变化的方向与实验因素之间没有相互作用。因此,在整个实验中观察到增加了最初的10个延迟。在10种情况下的类型1处理(即,选择正确的初始响应,随后进行更改)可能确实比在变化类别的其他方向上发生的类型1处理要慢。

3.2.4 响应时间–最终响应

基本比例任务:方向改变和实验对模型匹配度(model fit)有显著主效应,无显著交互作用。

三段论任务一样。

对变化方向主要影响的后续测试表明,如目测所示,被试改变其初始响应(10和01)的情况下的最终响应时间要长于(11和00)情况下的最终响应时间。初始响应未更改。针对实验主要效果的探索性后续测试表明,在设定初始期限的两个条件下,最终响应时间有些出乎意料(实验2:期限和实验4:期限+负载)也倾向于比没有初始限制时间的条件下更快。

尽管从来没有第二次反应的限制时间,但被试以前曾面临过这样一个事实,这也往往使他们加快了最后反应的速度。

3.2.5 自信-初始反应

三段论任务:方向改变对模型匹配度(model fit)有显著主效应,实验没有,无显著交互作用。

对变化方向的主要影响进行的后续对比测试表明,两个变化类别(10和01)的视觉识别趋势显示,其初始置信度较低的趋势也很明显。

基本比例任务:方向改变和实验对模型匹配度(model fit)有显著主效应,有显著交互作用。

关于变化方向的主要影响,后续测试确定,与三段论推理任务一样,对初始响应发生变化的两个类别的初始置信度要低于无变化类别。存在交互作用,检验是否所有实验中都存在影响:实验1、2、4显著,实验3不显著。

3.2.6 自信-最终反应

三段论任务:方向改变对模型匹配度(model fit)有显著主效应,实验没有,无显著交互作用。

对变化方向的主要影响进行的后续对比测试表明,两个变化类别(10和01)的视觉确定的趋向于降低最终置信度的趋势很明显。

基本比例任务:方向改变和实验对模型匹配度(model fit)有显著主效应,无显著交互作用。

关于变更方向的主要影响,后续测试确定,如在语段推理任务和初始置信度分析中一样,对10和01变更类别的最终置信度低于00和11类对变更的最终置信度。 b = 15.34,t(117)= 7.522,p <0.0001,r = 0.57。

总而言之,这些分析支持了从视觉上识别出的主要趋势。在三段论推理和基本速率任务中,我们在整个实验中始终观察到,答案的改变与降低的响应自信心和更长的最终重新思考时间有关。

3.3 冲突检测分析

在人们最终给出正确的最终响应的情况下,他们已经选择了此响应作为其最初的,直观的响应。这表明可以通过快速和自动的Type 1进程生成正确的逻辑响应。

需要研究在第一阶段是否存在2个相冲突的直觉反应。

通过观察冲突和无冲突问题之间的对比来解决这个问题。如果冲突问题提示了两个相互冲突的初始直观响应,则在初始响应阶段,人们应以与无冲突问题(不存在此类冲突)不同的方式处理问题。

我们对每个变化方向类别中对冲突问题的第一响应的置信度等级与对无冲突问题的第一响应的置信度进行了对比。

解决所有变化方向的冲突问题时,任务和实验的总体趋势是初始信心下降。但是,对于01和10案例,这种影响要大得多,在这种情况下,推理者随后更改了其初始响应。这表明,尽管在所有情况下,推理者在直觉之间可能都存在一些冲突,但在10和01情况下,这种冲突更为明显。

图5

3.3.1 “11”

类别“11”的结果表明,对于基本比率问题,冲突的主要影响是显着的,v2(5)= 41.94,p <0.0001。实验没有显着影响,v2(8)= 7.24,p = 0.065,无显著交互作用,v2(11)= 1.97,p = 0.58。与基线状态相比,人们对11类的信心较差。

三段论任务一致。

3.3.2 “00”

在基本比例任务中,冲突的影响很明显,v2(5)= 31.17,p <0.0001,实验的效果也显著,v2(8)= 11.74,p = 0.008,但没有交互作用,v2( 11)= 6.12,p = 0.11。人们对00响应的信心较基线低,b(279)= 5.598,t(279)= 5.657,p <0.0001,r = 0.32。在三段逻辑推理问题中,冲突的影响没有达到显着性,v2(5)= 3.35,p = 0.067,条件的影响不显著,v2(8)= 2.53,p = 0.47,交互作用不显着,v2(11)= 2.67,p = 0.45。

3.3.3 “10”

对于基本比例问题,冲突的主要影响显著v2(5)= 42.85,p <0.0001。实验因子v2(8)= 7.72,p = 0.052,相互作用没有达到显着性,v2(11)= 1.48,p = 0.686。这10个答案的置信度比基线条件低,b = 20.58,t(37)= 6.667,p <0.0001,r = 0.74。对于三段论推理问题,发现了相似的结果。有显着的冲突影响,v2(5)= 72.81,p <0.0001,但条件没有显着影响,v2(8)= 2.3,p = 0.51,无显著相互作用,v2(11)= 5.72,p = 0.13 。 10例的初始置信度低于基线条件,b = 24.54,t(44)= 8.834,p <0.0001,r = 0.8。

3.3.4 “01”

在基本比例任务中,发现冲突很明显,v2(5)= 93.62,p <0.0001,条件也显著v2(8)= 10.65,p = 0.01,并且有显著交互作用v2(11)= 13.26,p = 0.0041。关于三段论推理问题,我们发现冲突,v2(5)= 46.82,p <0.0001,以及交互作用,v2(11)= 7.84,p = 0.049,显着改善了模型拟合,但实验无显著主效应,v2(8)= 4.36,p = 0.23。由于交互作用,我们还分别为每个实验运行了冲突对比。如图5所示,尽管对于基本速率任务,在实验4(截止时间+负载)中,置信度的降低尤为明显,但我们的分析表明,在四个实验中的每个阶段,在每个实验条件下,其置信度都达到了显着水平。在三段论推理任务中观察到类似的模式。尽管仅在指令条件下,冲突因子未能达到显着性,但其他所有类别均存在这种影响。

综上,对第一个直觉答案的置信度等级的冲突检测分析表明,从总体上来说,在所有的方向变化类别中,大多数被试在对冲突问题给出第一个直觉答案后,其回答自信度降低了(与无冲突基线相反)。这支持以下假设:在解决冲突问题时,被试总是面临两个矛盾的反应。表明尽管推理者可能会生成两个直观的响应,并且在所有情况下都受到它们之间冲突的影响,但是在人们随后改变答案的情况下,这种冲突更为明显。有力地表明,正是这种更为明显的冲突经历使他们随后改变了答案。

4.讨论

在本研究中,我们旨在研究经典默认干预双重过程理论(DI)的时间过程假设。 DI理论表明,默认情况下,推理程序通常会产生快速,直观的响应(第1类),随后,该响应可能会被其他更深思熟虑的过程所覆盖(第2类)。最初的第一类快速答案被认为是基于定型观念或共同信念的启发法驱动的,因此在“冲突”情况下(定型观念或共同信念所暗示的答案与逻辑答案不同)最初的直觉产生了错误的答案。预计类型2的思考会优先于此响应,但是有时类型2的处理也会失败,这会导致推理偏颇。因此,原则上,对冲突项的正确响应必须源自根据DI理论进行的缓慢的,故意的Type 2处理。

在本研究中,我们使用两个响应范式来检验此假设。在这种范式中,人们被指示给出一个非常快速的初始响应,然后分配他们想要表明最终响应的时间。我们还使用了不同的研究设计,以最大程度地降低参与者进行初次回答时进行2型处理的可能性,从而确保参与者提供的初次回答本质上是直觉的。

与DI预测相反,我们的主要发现是“11”类别的频率相对较高(总体上为+ 30%),这表明人们在直观上给出了正确的答案。置信度和潜伏期分析表明,在初始和最终响应阶段,11和00类别的答案都可以快速且高度置信地给出。对于推理者更改其初始答案的罕见的01和10响应,我们观察到的与之前的观察结果一致。

我们检查了人们在初始响应阶段是否面对两种直觉。因此,我们对比了冲突和无冲突问题的初始置信度和等待时间。最初的反应潜伏期没有差异,但置信度等级确实表明参与者在变化的各个方向上都普遍存在一些冲突:与无冲突试验相比,推理者对冲突答案的正确性缺乏信心。说明被试在面对冲突问题时通常整合逻辑和启发式直觉。尽管在所有变化方向上的推理者都可能在竞争直觉之间发生冲突,但是在改变初始答案的情况下,这种冲突似乎更为突出。

除少数例外,我们的发现在两项推理任务和我们进行的四项不同研究中都是一致的。这种稳定性表明,这些发现是非常可靠的,并且将由任何特殊任务或实验特征导致的结果的可能性降到最低。

核心发现是,人们能够直观地给出解决冲突问题的逻辑答案。我们将这种现象称为快速或1型逻辑,以将其与基于2型处理的缓慢而苛刻的逻辑推理进行对比。但是,应该强调的是,尽管两种类型的逻辑响应的结果可能是相同的(即,选择正确的响应),但这显然并不意味着底层的处理也是相似的。也就是说,我们不认为人们正在经历与第2类案例完全相同的复杂计算,而只是在第1类案例中执行这些运算的速度更快。显然,关键是两种类型的逻辑响应都基于不同类型的过程(即类型1和类型2),因此具有不同的特性。总而言之,本研究表明,从推理过程开始,快速,自动的1类处理可以提示正确的逻辑响应。这种结果模式有助于建立一个模型,在模型中,不同类型直觉的相对强度决定推理性能。

2.不足之处和未来研究方向

1.如何完全区分1类加工和2类加工。

2.选择性作答,是不需要被试明确得出结论的,是否会对1类加工有影响?(作者认为有被试失败说明任务是有一定难度的,且如果让被试直接输入答案,不可控因素过多)