一阶段二阶段理论与各实验的联系



一、一阶段/二阶段理论与实验1 ¶

假设最终预测是一致的。但最初的预测也是一致的吗?换句话说,理解者最初的预测方式是否与他们最终的预测方式相同,因此是否与理解者的信念一致?(所谓初始预测,指的是快速发生的预测,并且之前没有其他预测)。 因此,文章对比了预测的一个阶段和两个阶段。根据一阶段的说法,最初的预测和最终的预测没有区别,所以预测最初是一致的。

在我们的例子中,男性理解者最初会预测女性说话者会提到一件典型的女性服饰。

In our example, the male comprehender would initially predict the female speaker will refer to a stereotypically feminine article of clothing.

但根据两阶段的说法,最初的预测与最终预测遵循不同的原则。文章注意到,预测取决于视角的选择,我们知道视角的选择可能很容易(例如,Lin、Keysar和Epley,2010)。因此,在最初的预测中,理解者可能会忽略背景知识的某些方面,但在最终的预测中会注意这些方面。如果是这样的话,他最初可能不会预测演讲者会提到一件刻板的女性服装。

有不同的两阶段预测,但文章确定了两种可能性。

在以自我为中心(egocentric)的两阶段理论中,男性理解者最初从自己的角度进行预测,也就是说,基于他自己在这种情况下的假设(例如,e.g., Keysar, Barr, Balin, & Brauner,2000)。在这种情况下,他最初预测,女性演讲者会提到一件典型的男性服装(例如领带),与他自己的性别观念相一致。

联系型(associative)两阶段观点中,理解者最初根据自动生成的associations进行预测(例如,Neely,1977;Perea&Gotor,1997)。因此,他以自下而上的方式激活单词词条的语义关联,并使用此激活最初预测说话人将指代任何可穿戴对象。在这种情况下,他最初预测说话人可能指的是典型女性化的服装(如连衣裙)或典型男性化的服装(如领带)。

如果男性理解者从处理的最早时刻就预测consistently(用文中的例子来说:预测dress而不是tie,与他对speaker性别认同和性别刻板印象的信念一致),并且没有一个阶段的预测不一致,那么一阶段预测的观点将是正确的。但是,如果他最初是以联想(这里指预测裙子和领带)或以自我为中心(预测领带而不是裙子)的方式进行预测,并且只在之后才预测一致,那么两个阶段的预测是正确的。

因此,在实验中,询问(1)理解者最终是以自我为中心、以联想为中心还是以一致性进行预测,以及(2)他们最初是以联想为中心、以自我为中心还是一致性进行预测。期望(1)的答案是,他们最终会做出一致的预测,但(2)的答案就不那么明确了。使用视觉世界范式(Cooper,1974;Tanenhaus,Spivey-Knowlton,Eberhard,&Sedivy,1995)在三个实验中测试了这些备选方案,该范式已被用于研究预测处理(Altmann&Kamide,1999)和视角采择。

对于性别化的句子,说话者总是提到与他们的性别在典型观念上一致的目标,这是由典型观念预测试的被试确定的(即,男性说话者提到领带,女性说话者提到衣服),因此参与者根据说话者的性别所做的任何预测总是准确的。而且(我们将看到)在实验1中没有发现自我中心预测的证据,这表明这些评分差异无法解释我们的影响。这些差异与实验2和3无关,因为说话者的声音对于确定一致的视角并不重要。 如前所述,每个项目有两个版本:一个由男性演讲者制作(例如,我想戴上漂亮的领带),另一个由女性演讲者制作(例如,我想穿漂亮的裙子)。参与者被分配到两个刺激列表中的一个,以便他们只听到每个项目的一个版本

男性speaker—> 典型男性形象:tie

女性speaker—> 典型女性形象:dress

分析了性别试次(即有明显性别特征的物品),以确定:(1)参与者是否具有associative预测能力(例如,在听到动词wear后看可穿戴物品);(2) 他们是否始终如一地(或以自我为中心)预测,fixating the target stereotypically compatible with the speaker’s gender over the target stereotypically consistent with their own gender (or vice versa);(3)associative预测是否发生在一致预测之前(符合两阶段预测),还是发生在一致预测之后(符合一阶段预测)

综上所述,分析表明,参与者从动词开始后450 ms开始进行关联预测,从动词开始后600 ms开始进行一致预测(即associative预测发生在一致性预测之前)。在动词开始之前,没有迹象表明存在预测性注视。 在第一次分析中,比较了A-CT的注视比例与与A-CD的注视比例,以确定参与者是否有关联预测。然后,通过比较A-CT的注视比例与与A-ICT的注视比例,确定参与者的预测是否一致。图2表明,在动词开始之前,参与者不会偏向一种object,而binning分析在动词开始之前没有显示出任何显著影响,因此从动词开始(0 ms)到动词开始后1500 ms进行了分歧点自举分析。

对以自我为中心的预测的排除:分析表明,参与者更关注A-CT,而不是A-ICT,因此表明他们进行一致预测。但这一分析是基于所有性别试验的,即参与者和说话者性别相同的试验(性别匹配试验)和他们性别不同的试验(性别不匹配试验)。如果参与者只是以自我为中心(从他们自己的角度)进行预测,那么在collapsed分析中,文章预计对A-CT和A-ICT的注视不会有任何差异,因为以自我为中心的预测有一半是正确的(性别匹配试验),而另一半是错误的(性别不匹配试验)。我们没有观察到这种效应模式,从图2中可以清楚地看出,参与者对与A-ICT的注视程度不超过对A-CT的注视程度。然而,参与者最初的预测可能是以自我为中心的,但自我中心效应被更大的一致性效应所淹没。所以在第三次分析中测试了这种可能性,重点是性别不匹配试验。特别是比较了A-CT和与A-ICT的注视程度,以确定参与者是否存在以自我为中心的预测阶段。性别不匹配分析表明,参与者没有以自我为中心进行预测。

bootstrapping分析表明,在动词开始后519 ms,参与者对与A-CT的注视程度高于A-CD(CI【500,650】;图2A中红色vs.绿色)。CI不包含零,因此支持两个对象之间的可靠差异。在性别中立(因为性别中立实验并不会有明显的性别区分,如男女演讲者都可以说"我想吃苹果")的试验中观察到了类似的模式:参与者在523 ms时对两个目标的注视多于对两个干扰物的注视(CI【500,650】;图3,)。请注意,该分析将两个目标与两个干扰因素进行比较,而性别试验的分析将一个目标与一个干扰因素进行比较。这些结果表明,参与者可以进行联想预测。

参与者还会一致地预测,从动词开始后641 ms起,对A-CT放入注视(说话人实际提到的目标,并且与说话人的性别相容)超过对A-ICT的注视(说话人没有提到的目标)(CI【600,950】;图2A中的红色vs.蓝色)。我们对性别不匹配试验的分析(图2B)证实,参与者没有以自我为中心进行预测的点:他们在651 ms时对A-CT关注度超过了A-ICT(且以自我为中心)的目标(CI【450,850】),他们对A-ICT的关注度也没有超过A-CT。此外,这些发现在性别匹配试验中基本上得到了重现(图2C):参与者在628 ms内对A-CT的注视多于对A-ICT(CI【500,850】),并且他们对A-ICT的注视程度也没有超过A-CT。因此,参与者从说话者的角度始终如一地进行预测,当他们听到一位女性说话者说我想穿漂亮的……时,他们会看到典型的女性目标(如裙子),但当他们听到一位男性说话者说出的同一句话时,他们会看到刻板的男性目标(如领带)。

图2A表明,一致的预测往往发生在关联预测之后。通过从一致性效应的开始中减去联想效应的开始,显著地检验了这种差异。该分析表明,关联效应和一致效应之间的发散点平均差异为122 ms(CI[0,350]),表明一致效应发生的时间晚于关联效应。

但是实验一存在的问题:假设被试这样做是从句子主体的角度出发的,因为代词是I,所以agent(即句子的主体)与说话者是一致的,但也可能会被试的注视只是由说话者的声音或者脸(即生理特征)决定的。(即我们说的三因素里面speaker特征和语言学特征的影响),要更进一步的了解注视是怎么引起的?

所以,为了更加确信参与者的注视不仅仅是由说话者的声音决定的,文章进行了实验2,该实验测试了当一致的视角是他们自己的而不是说话者的观点时,理解者是否能够始终如一地预测。实验2也将视角采择的影响与说话者性别的影响分开。同时,它还进一步检验了关联预测是否发生在一致预测之前。

二、一阶段/二阶段理论与实验2 ¶

一个句子有四种版本(version):

男性speaker—-> 典型女性形象: dress

男性speaker—-> 典型男性形象: tie

女性speaker—-> 典型男性形象: tie

女性speaker—-> 典型女性形象: dress

被试听到每种句子的一种版本,并且以听到与自己性别一致的目标结束。

女性被试:女性speaker—-> 典型女性形象: dress

​ 男性speaker—-> 典型女性形象: dress

男性被试:男性speaker—-> 典型男性形象: tie

​ 女性speaker—-> 典型男性形象: tie

这里的agent-compatible:指的是与"You"指代对象一致的,在实验二中就是被试

与实验1一样,实验2的bootstrapping分析表明,参与者使用动词快速联想预测。尤其是,在动词开始后329 ms,参与者对A-CT的注视程度高于与A-CD(CI【250,500】;图4A中红色vs.绿色)。同时在性别中立的试验中观察到了类似的模式:参与者在447 ms时对两个目标的注视多于对两个干扰物的注视(CI【400,600】;图5) ,同样的,关联预测发生在一致性预测之前,符合双阶段理论。

参与者还一致预测,从动词开始后939 ms起,对A-CT的注视(说话者实际上提到了该目标,并且在刻板印象上与参与者的性别一致)超过了对A-ICT的注视(说话者没有提到)(CI【800,1050】;图4A中的红色与蓝色)。对性别不匹配试验的分析(图4B)证实,参与者的预测没有不一致的时候:从995 ms开始,他们对A-CT(且以自我为中心)的注视超过了对A-ICT的注视(CI【1000,1050】),他们对A-ICT的注视也没有超过对A-CT的注视。因此,参与者并不是简单地听到说话者的声音或者看与说话者性别一致的照片。相反,他们总是从自己的角度进行预测。例如,一名女性参与者在听到演讲者说You would like to wear the nice…,,不管演讲者的性别,都会看着dress。我们对性别匹配试验的分析(图4C)基本上重复了这些发现:参与者在958 ms时,更关注A-CT,而不是A-ICT(CI[900,1050])。关联效应和一致效应之间发散点的平均差异为611 ms(CI[400,800])。置信区间不包含零,因此提供了强有力的证据,证明一致性效应发生的时间晚于关联效应。

实验二发现,参与者的预测是一致的:他们注视的是与自己的性别一致的A-CT目标,而不是与说话人的性别一致的A-ICT。例如,听到“你想穿漂亮的……这句话”的女性参与者会更关注dress而不是tie,而不管说话者的性别。重要的是,这一发现表明,实验1中一致的预测并不仅仅是因为参与者听到了说话者的声音,或者注视与说话者性别一致的物体。相反,这些结果表明,参与者应考虑agent的视角,从而始终如一地进行预测。

**问题:**也就是说实验二并不排除speaker的性别带来的影响?而是进一步说明视角采择或者说是语言学特征带来的注视差别?

三、一阶段/二阶段理论与实验3 ¶

该实验与Kamide等人(2003年)的实验2有一些相似之处(见Evidence for a one-stage account)。他们发现,参与者在听到动词后立即做出一致的预测,在听到The man will ride…时,比在听到The girl will ride….时,更关注摩托车的图片…。联想效应随后出现(在听到动词后面的单词时):参与者在听到The girl will ride….,比听到The girl will taste….后,更专注于摩托车…。如果我们复制他们的发现模式,我们会期望参与者最初一致地预测,并最终进行关联预测。然而,这并不是我们在实验1-2中观察到的结果模式,在实验1-2中,参与者最初进行关联预测,然后最终进行一致预测。因此,我们比较了关联预测和一致预测的时间过程,并研究了是否发生了以自我为中心的预测。

每个演讲者都会造出涉及James or Kate的句子,因此每个项目有四个版本,参与者被随机分配到四个刺激列表中的一个,因此他们每个项目听一个条件。

Female: Kate would like to wear the nice dress

Male: Kate would like to wear the nice dress

Male: James would like to wear the nice tie

Female: James would like to wear the nice tie

注:这里的agent是句子内容指向的James or Kate

bootstrapping分析表明,在动词开始后384 ms,参与者对与A-CT的注视程度高于A-CD(CI【350,500】;图6A中红色vs.绿色)。在性别中立试验中,参与者在537 ms以后也会更多地注视目标,而不是干扰物(CI【450,750】;图7)。综合起来,这些结果表明,参与者可以进行联想预测。

参与者也一致预测:从动词开始后636 ms起,他们更专注于A-CT(与角色的性别在刻板印象上是一致的),而不是与A-ICT的目标(CI【500,850】;图6A中红色vs.蓝色)。我们对性别不匹配和性别匹配试验的单独分析证实,参与者在任何时候都不会以自我为中心进行预测:在性别不匹配试验中,从583 ms开始(CI【450,1000】;图6B)和在性别匹配试验中从848 ms开始(CI【800,1050】;图6C),他们更关注A-CT,而不是A-ICT(和以自我为中心)。因此,参与者从角色的角度进行一致的预测,例如,当他们听到Kate would like to wear the nice…的句子时,他们会盯着裙子……但当他们听到以James开头的同一句话时,他们会盯着领带。

与实验1和2一样,这种一致性效应发生的时间晚于联想效应。特别是,关联效应和一致效应之间发散点的平均差异为252 ms(CI[500850])。

四、结论及其他 ¶

在实验1中,参与者从说话者的角度、在实验2中从他们自己的角度以及在实验3中从角色的角度进行一致的预测。在所有三个实验中,这些一致的预测发生得比关联预测晚(尽管在实验1中这种差异是微乎其微的)。

我们注意到,有很多证据表明,在语言理解过程中可以立即使用上下文信息(如Tanenhaus等人,1995年;Trueswell等人,1994年),包括与视角相关的信息(如Hanna等人,2003年),以及与说话人声音相关的刻板印象相关的信息(Van Berkum等人,2008年)。这些发现被用来支持理解的一个阶段。但文章的发现表明,他们的结论只与自下而上的理解有关,而与预测无关。具体来说,文章认为,理解者最初通过联想(在文章的例子中,通过固定与动词相关的对象)进行预测,然后在第二阶段利用其他相关信息(这里,与性别相关)。

在实验中,文章研究了不同类型的一致性预测。具体而言,一致性预测是(1)基于说话人的视角(实验1);参与者的视角(实验2);或者(3)第三个角色的视角(实验3)。以往的视角选择研究只关注说话者和理解者的视角发生冲突时会发生什么,例如理解者知道说话者看不到的对象时(例如,Keysar等人,2000)。相反,文章的实验表明,理解者可以权衡多个视角(例如,他们自己的、说话者的和第三个角色的),并使用一致的视角进行预测。换句话说,理解者在观点选择上是灵活的,并采用最有可能得到准确理解的观点。

此外,在实验1和3中,参与者在关键动词641 ms和636 ms内进行了一致的预测,比实验2的参与者(939 ms)的预测速度要快一些,尽管文章没有进行任何交叉实验比较。原则上,实验2的参与者可能不太相信性别刻板观念或不太明确男性或女性。更有可能的是,实验2的参与者并不总是或最初将代词You解释为指代他们自己(例如,Bruny’e、Ditman、Mahoney、Augustyn和Taylor,2009)——他们有时可能对You进行一般性的解释(意思是“一”),或者可能没有将录制的声音视为对他们的称呼(例如,他们可能认为自己听到的是另一个addressee的话语)。

总之,三个视觉世界范式实验证明,理解者在预测语言时会考虑视角,但在预测的最早时刻不会这样做。结论是,预测在理解过程中分两个阶段进行。

其他研究方向:双阶段主要由什么因素导致?还是多种因素综合作用?

如果只存在声学特征,有没有一样的效果?