阅读和信息处理中的眼动:Keith Rayner



文献:Clifton Jr, C., Ferreira, F., Henderson, J. M., Inhoff, A. W., Liversedge, S. P., Reichle, E. D., & Schotter, E. R. (2016). Eye movements in reading and information processing: Keith Rayner’s 40 year legacy. Journal of Memory and Language86, 1-19. https://doi.org/10.1016/j.jml.2015.07.004

1. 引言 ¶

Keith Rayner对认知心理学的贡献非常卓越。Rayner最初的研究集中在阅读时如何控制眼球运动,他的早期研究将Huey早期(1908/1968)阅读分析中的许多主张建立在实证基础上,Rayner的工作回答了Huey提出的许多问题,提供了重要的证据,例如,关于知觉广度的性质,即在单眼注视过程中获得有用信息的区域,同时他把自己的工作拓展到Huey从未考虑过的问题上,下面逐个讨论Rayner的主要成果。

2. 眼动控制和知觉广度 ¶

Keith Rayner对知觉广度和眼动控制的研究基于这样一个信念:从文本中提取视觉信息的实验研究应该为建立阅读理论提供经验基础。阅读从根本上是一种从印刷页面中提取信息的行为,这种“自下而上”的方法很符合他的信念,这种方法与被广泛接受的观点发生了严重冲突(McConkie & Rayner, 1975),即熟练阅读是一种语言猜谜游戏,主要是有效的自上而下加工的功能,而知觉加工是粗略的,对阅读的贡献相对较小(Goodman, 1970; Hochberg, 1970; Levin & Kaplan, 1970)。Rayner及其同事推翻了这一观点,他们的研究证明,有经验的读者基本上会看文本中的每个单词,快速有效地提取视觉信息的能力是熟练阅读的基础。

McConkie 和 Rayner(1975;Rayner 1975)开创了新的实验技术,使研究人员能够精确地确定在阅读过程中何时从文本中提取了信息,这些技术基于一个事实(Javal, 1878),即在阅读时,眼睛会短暂地注视一个单词,使其落在视网膜中央凹和副中央凹处,那里的视敏度较高,然后跳跃(“扫视”)开始新的注视。移动窗口技术使研究人员能够实时监测眼睛的位置,并控制相对于注视位置的文本的空间和时间可见性。在最初的研究中(McConkie & Rayner, 1975),当注视开始时,在被注视的字母周围可以看到完整文本的“窗口”,并且在阅读过程中它与眼睛同步移动,窗口的大小经过实验控制,从相对较小的只包含一个字母,到非常大的包含一行文本。实验控制的窗口大小的影响通过自然发生的眼动反应进行观察,并分析不同的反应成分,包括注视时间、眼跳大小和眼跳方向,以确定如何提取信息并用于眼球运动的计时和目标。

Rayner(1975)还开发了一种边界技术,该技术也允许研究人员评估在单次注视期间从旁凹提取的信息类型。在边界技术中,文本的呈现取决于扫视的执行,该扫视将眼睛移过实验定义的(不可见的)空间边界。在跨越边界之前和之后存在于该位置的文本属性可以被完全控制和操作。在原始研究中(Rayner, 1975),在句子阅读的开始和跨越边界之前的注视过程中,目标词在旁视区中的位置要么被目标词本身所占据,例如单词chest、字母相似的单词或非单词,例如chart和chovt,要么被不相似的非单词所占据,例如ekovf。越过边界的扫视启动显示更改,将原来的项目替换为目标词。随后的目标观察检查显示,当在旁凹可见字形相似的字母序列时,观察时间比预览不相似时短。在1975年的数据中,促进作用的数量(通常称为预览益处)取决于先前注视的边界有多近,在距离边界6个字符的范围内,当将字母相似的非单词与字母不相似的非单词进行比较时,第一次注视持续时间缩短了约30ms,当预览与目标单词相同时,第一次注视持续时间增加了约50ms。

在过去的40年里,许多研究使用窗口和边界技术来阐明阅读注视过程中信息的提取及其与眼动编程的协调。Keith Rayner对这些成果做了整理及综述,这些综述讨论了有用信息提取的文本空间区域、提取信息的性质、信息提取的时间过程和眼动规划。这些综述中所涵盖的研究结果使Rayner和他的同事形成了一个关于信息提取和眼动编程的理论概念,通常被称为顺序注意力转移模型,这个概念在Rayner的职业生涯中逐渐得到完善,最终形成了E-Z Reader模型。

早期的研究,主要是通过移动窗口技术进行的,发现当读者看到中央注视的字符和左右少于16个字符时,阅读速度会降低,眼球活动也会受到干扰 (McConkie & Rayner, 1975; Rayner & Bertera, 1979; Rayner, Inhoff, Morrison, Slowiaczek, & Bertera, 1981),即使是在不受限制的情况下,扫视的平均大小也大约是8个字符的间距,这意味着眼睛被移到了文本的中央凹旁位置,从中提取了一些有用的信息。对于小窗口,窗口外粗粒信息的类型很重要(McConkie & Rayner, 1975),这表明信息的摄取是分级的,包括在注视处和近注视处提取图形细节,以及从更远处副凹提取粗粒信息。 Rayner, Well, Pollatsek和Bertera (1982) 表明,有关字形细节的有用信息是从单词注视右侧的前三个字母中获取的,但提供完整单词的预览(或注视右侧的两个单词)并不能进一步加快阅读速度。他们得出的结论是,在副凹处获得的字形信息并没有启动单词级别的处理。

这项研究还表明,在注视过程中成功提取信息决定了注视的持续时间和发出扫视的大小。使用现在称为“刺激启动延迟范式”的方法,在窗口内文本启动的延迟高达150ms将增加几乎相应数量的注视时间,副中央凹间词间隙的填充减少了扫视的大小,即使这些间隙只在注视的最初50ms内被填充。从文本的注视部分提取语言信息,大概是为了视觉单词识别,从旁凹更远处提取单词长度信息,大概是为了瞄准扫视,因此从注视开始。诸如此类的现象,证明阅读中的眼球运动在很大程度上受到词汇和其他语言处理的直接控制。

进一步的研究表明,当窗口缩小的位置放在注视物的右侧而不是左侧时,阅读会受到更大的阻碍(McConkie & Rayner, 1976; Rayner, Well, & Pollatsek, 1980),这表明,从左到右顺序的英语文本,信息的提取是不对称地向右扩展的。当阅读希伯来语句子(Pollatsek, Bolozky, Well, & Rayner, 1981)和阅读从右向左排列的英语句子时,这种不对称发生了逆转,而且这种情况与单词中的字母顺序无关(Inhoff, Pollatsek, Posner, & Rayner, 1989)。因此,信息提取的范围由阅读方向决定,延伸到包含即将出现的单词。知觉广度在眼睛移动方向上是不对称的,这一发现是连接眼球运动和注意力的重要证据,在阅读的计算模型中起着重要作用,我们将很快讨论这一发现。知觉广度在眼动方向上是不对称的,这一发现是连接眼球运动和注意力的重要证据,在阅读的计算模型中起着重要作用。Morrison(1984)对这项研究进行了综合及有影响力的总结,并作为E-Z阅读器模型的框架,Morrison的顺序注意转移模型认为,读者从固定词(N)中提取语言信息,直到达到加工的阈值。越过这个阈值后,注意力转移到下一个单词N+1,出现相应的扫视,从N+1位置提取字形信息,直到执行扫视。完整单词N+1预览的语言属性影响了它的有用性,从单词的N+1位置提取的信息可用于激活其语音表征,此外,从单词N+1中提取有用信息不仅与它本身的词汇属性有关,还与处理单词N的容易程度有关(Henderson & Ferreira, 1990),即随着中心凹单词识别难度的增加,对旁中心凹可见信息的使用减少。

关于信息提取和眼动控制之间关系的几个方面仍在争论中,有两组问题影响了该领域的大部分近期工作:

如果在提取语言信息之前,对副中央可见的单词进行扫视,就像顺序注意转移模型所认为的,那么接下来单词的语言属性不应该影响固定单词N的观看。然而,在一些实验研究中和语料库分析已经报道了这种POF效应。为了支持最初的顺序注意力转移假设,Rayner、Pollatsek、Drieghe、Slattery和Reichle(2007)指出,在语料分析中,项目选择影响POF效应的发生。在所有的研究中,实验的POF效应也是难以捉摸的,可能是因为它们在注视单词N时相对较晚才产生,也可能是因为它们到观看接下来的单词N+1时才发生。Drieghe, Rayner和Pollatsek(2008)表明,在观看第N个单词时,实验POF效应可能是例外,而不是规律,因为它们主要发生在对第N个单词的注视接近第N+1个单词时。

如果眼睛移动到一个单词上是为了完成它的识别,那么当语义信息已经从这个单词中提取出来时,读者应该很少移动到单词N+1上。与这一预测一致的是,一些使用边界技术的研究表明,没有语义信息提取从旁凹,然而,Hohenstein, Laubrock和Kliegl (2010;Hohenstein & Kliegl, 2014)同样使用边界技术,表明一个单词在N+1位置的语义属性可以影响在该位置查看目标单词的时间。与这一发现一致的是,Schotter(2013)表明,当预览的单词和随后注视的单词是同义词时,副中央凹单词N+1预览减少了在该位置查看目标单词的时间。Schotter, Lee, Reiderman和Rayner(2015)最近扩展了这一发现,表明当语义联想在语义上与之前的上下文和目标相关时,副中央凹N+1预览会促进在该位置观看目标词。语料库分析(Vitu, 2005;Vitu & McConkie, 2000)和实验研究(White, 2008)表明,跳过N+1字会增加重读的概率,就好像识别没有成功一样。在Wang和Inhoff(2013)的研究中,在大约三分之一的试验中跳过了一个副中央可见的三个字母的目标词,在多达四分之一的试验中也跳过了相应句子位置的随机字母串(用于掩盖目标预览)。

这些结论对当前固定目标之外的两个单词的处理有影响,如果眼睛指向一个单词来完成它的识别,如果单词是按顺序处理的,那么从单词N扫视到N+1应该意味着从N+2中没有提取有用的语言信息,但是根据Kliegl, Risse和Laubrock (2007),当N+1的单词较短且熟悉时,读者可以从N+2预览中提取信息(Kliegl等人,2007)。为了回应这些发现,Rayner, White, Kambe, Miller,和 Liversedge(2003)指出,眼睛有时可能无法落在目标的中央凹旁单词上,当眼睛盯着单词N+1,但却落在单词N上时,POF效应就会发生。当扫视分别低于和超过目标位置时,可能会发生对副凹识别的单词的偶尔注视和跳过随机字母的短序列。到目前为止,N+2预览效果已获得短的N+1个单词,其目标可能会出错。

总之,两种范例的使用使研究人员可以根据读者看的地方来操纵文本的属性——移动窗口和边界技术——提供了重要的证据,证明了在注视的过程中,不仅从当前注视的单词中提取信息,而且从位于中央凹旁区域的单词中提取信息。表明,读者主要从当前注视的单词和后面的单词中获取信息,词汇处理控制着注意力和眼睛的运动。从这些研究中得出的结论证明了Rayner的理论信念,即注意力驱动眼球运动系统,而注意力的转移是由词汇加工的程度驱动的。

3. 词汇加工 ¶

Rayner对阅读过程中眼睛如何运动的研究加深了对心理加工过程的理解,从单词视觉编码的最初阶段一直到对应的心理表征在词典中被唯一识别,不仅要理解这些过程本身的性质,还要确定它们在正常阅读时如何映射到对句子中的注视单词。这一领域最重要的成就之一是Rayner和他的同事在他们的工作中所取得的专一度,他们在词汇识别的子过程和阅读中与眼动控制相关的机械过程之间的关系中形成了一个明确的映射。Rayner最早证明视觉编码是在对一个词进行直接定位之前就开始的,但对该词的完整词汇识别可能发生在对该词本身的定位过程中,甚至是在对句子下游的单词进行定位时,当一个单词被跳过,或者当所谓的“溢出效应”发生时,就会出现这种情况。

Rayner认为有三大因素影响阅读中对单词的加工:频率、长度和在上下文中的可预测性,Rayner把称之为三大特性。词频效应即人们发现读者在读那些在语言中出现频率高的单词时花费时间比低频词短,这种效应不仅出现在单词间隔的字母语言中,也出现在无间隔的非字母语言中即单词在视觉上不是很明显的语言单位,如汉语。其次,Rayner发现词的长度也是影响读者加工词汇所需时间的一大因素,越长的单词字母组合越多导致更多的视觉和语言信息的加工,并且单词的长度不仅影响眼球何时移动,也影响眼球移动到哪里。一些研究使用边界范式呈现关于即将出现的副中央凹单词长度的正确或不正确的信息(例如把“back hand”作为“back and”的预览),这些实验的结果表明,扫视是基于单词在副中央窝的长度。因此,当对副中央凹处的单词进行扫视时,如果关于该单词的长度信息是错误的,阅读就会受到干扰。最后,较好预测的单词被跳过的次数更多,停留的时间更短,回视后重新注视定的次数更少,并且可预见性对不同阅读水平的读者有不同的影响(Ashby, Rayner, & Clifton, 2005),即当阅读技能较低的读者专注于一个相对罕见的单词时,话语语境的影响尤其强烈。这三大特性是E-Z Reader模型等阅读过程中眼动控制的正式计算解释的支柱。

Rayner在词汇歧义对阅读中眼动控制的影响也投入了很大的精力,这些相关的研究中用到的句子都含有语义歧义的目的词,并且目标词两种语义是平衡的即这两个意思在语言中出现的频率是相同的(例如case, pitcher),或者是不平衡的即一种意思的少于另一种意思的出现(例如bank, table)。发现,当一个词处于不平衡状态时,当它出现在句子中所提供的先前上下文倾向于次要的意思时,阅读速度就会比先前上下文倾向于目标词的主要意思时慢(例如,单词bank在语境The alligator left the ——下的阅读速度比在语境The robber left the ——下的慢)。Rayner把这种现象称之为‘‘subordinate bias effect”,这一发现有助于激发他们对词汇歧义处理的 ‘‘reordered access model”,该模型假设一个语境使一个歧义词的意思偏向于较次要的意思,会导致该意思与较次要的意思竞争。

消失的文本范式即读者注视的单词在注视开始后(通常在大约60ms后)短时间内消失(或被盖住),原始研究Rayner et al. (1981) 的研究表明当单词在注视后不久消失时,阅读不会受到干扰。Rayner及同事后续的研究发现,即使在文本消失的情况下,读者仍然会在该单词消失的地方停留一段时间,这与该单词出现的频率直接相关,当单词是高频的时候,读者锁定空白的时间比单词是低频的时候要短,这一结果证明语言而非视觉处理是影响阅读过程中何时移动眼睛的主要因素,这一发现也强调了单词识别作为阅读中眼球运动的驱动因素的中心地位,这是E-Z Reader模型的核心假设。通过让即将出现的单词而不是注视单词消失,该范式被用于检查副中央凹以及中央凹处理。这种操作对阅读产生了明显的干扰。最近,这个范式也被用于研究儿童的阅读,这项工作建立在调查儿童阅读的早期眼动研究(Rayner, 1986)的基础上,该研究表明,当儿童阅读时,他们的注视时间比成年人更长。Blythe等人(2009)利用消失文本范式对Rayner的早期研究进行了后续研究,并调查了儿童注视时间的增加是否可能是由于他们在注视的早期对单词进行视觉编码的效率较低造成的。Blythe等人的研究结果显示,儿童在视觉编码方面的效率与成人一样高,这一研究和后来的研究现在导致了一个普遍接受的观点,即儿童阅读中固定时间的增加主要是由低效率的语言处理而不是视觉处理造成的。

Rayner 等人讨论了研究调查和评价最有效的阅读教学技术,并得出,让儿童成为熟练的读者,必须掌握字母原则,即在语言的书面形式中,不同的字母对应不同的发音。第二个重要结论是,直接的语音教学是一种让孩子理解字母原则的有效方法,而其他如整个单词或整个语言的方法的效果较差。在Rayner的研究中,有关词汇加工的发现和结论与眼动控制和知觉跨度的研究密切吻合。两者都强调单词作为阅读和眼动控制的基本单元的重要性,表明文本中的每个单词都必须被正确识别,并且当词汇处理变得更容易时,阅读过程也就更容易了。

4. 句子和语篇加工 ¶

Rayner 和 Well (1996)用完形填空的操作,可预测性低的阅读速度比可预测性中等和可预测性高的要快,而后两种的阅读速度则无显著性差异,即词之间的过渡概率过低会影响阅读速度。

Rayner及其同事发现单词 carrots 在异常上下文中(John used a pump to inflate the large carrots for dinner)的阅读速度比合理的句子(. . .used a knife to chop. . .)或者不合理的句子(. . .used an axe to chop. . .)要慢,异常效应显示在对目标词的首次注视时间上,然而合理和不合理条件下的差异显示后期即在对目标单词注视总时间,这表明合理性的影响在阅读的后期例如可能是整合阶段。相关研究也发现即使在具备魔幻语境下,那些不可能搭配的词也会延长读者的注视时间,但是魔幻语境可以减少读者回视。

Rayner和Lyn Frazier (Frazier & Rayner,1982)使用眼动测量来研究包含暂时句法歧义的句子的理解,这使所谓的句子处理的“花园路径”理论的发展。一种歧义是‘‘late closure” 另一种‘‘minimal attachment”。对于句子“Jay always jogs a mile (this) seems like a very short distance to him.”,如果读者的处理策略是尽可能地向短语中添加单词,他们会将该短语“a mile”作为动词jogs的直接宾语。当存在this时,与此结构分析一直,而当不存在this时,这样分析导致动词短语提前关闭,违法了后期关闭,导致a mile作为主句的主语。而对句子The second wife will claim the inheritance (belongs to her)的最小分析则把inheritance作为 claim的直接宾语,非最小分析则inheritance是补语的主语。如果读者倾向于延迟关闭和最小附件分析则会沿着花园路径,当这些分析不成立的时候(通过去掉延迟闭合例子中的this或在最小附件分析中加上belongs to her)阅读就会受到干扰。Rayner等人发现读者在阅读两种句子的歧义消除区域时,眼球运动受到干扰,Rayner等人把这一结果解释为读者一开始对句子只启动一种分析,遵循后期关闭和最小附件策略,当分析被打断时必须修改他们的分析。