目标和策略影响句子理解中的词汇预测



文献:Brothers, T., Swaab, T. Y., & Traxler, M. J. (2017). Goals and strategies influence lexical prediction during sentence comprehension. Journal of Memory and Language, 93, 203–216. http://dx.doi.org/10.1016/j.jml.2016.10.002

原文

1.文章概述 ¶

预测性加工是语言理解的一个关键因素,但是理解者如何、为什么进行词汇预测尚不清楚。

ERP成分:单词预测性是影响N400振幅的主要因素之一。N400预测效应是由词汇和语义特征预激活的,最终导致便利的预测单词神经处理。post- N400 positivity(PNP)和上下文敏感性有关。

目的:研究词汇预测是根据上下文自动激活还是有策略地预测促进文本加工。

24个大学生,平均年龄20.3岁,英语母语,没有神经阅读障碍。

180个单词,每个单词是一个2句话语篇中的最后一个词,每个单词出现2次,一个中等限制的语篇,一个低水平(不可预测)的语篇。

每个被试看180个文章,2种条件(理解、预测)*(60个中等填空+30个低水平填空)

EEG记录阶段:每个试次的开始,文章的第一句话全部呈现,被试按自己的速度阅读、理解,直到按下按钮表示继续,按下按钮后出现一个十字1000ms,第二句话一个词一个词的呈现,快速连续视觉呈现(RSVP)。

实验第一部分,理解,1/4刺激后有一个真假理解问题。第二部分是预测,被试主动报告预测是否正确。

  • 行为

在阅读第一句话时,在理解区组中比预测区组花费的时间更长,理解区组,回答真假理解问题的正确率为92%,预测区组,中等填空句子的正确率49.9%,低水平正确率4.2%。说明被试在认真注意语篇段落。

  • EEG结果

图1

在两种任务中,N400在200ms左右出现,在400ms左右差异最大。填空效应的大小在2种任务中不同,和理解任务相比,预测任务中中等填空的句子N400振幅下降较大。在2种任务中PNP在不可预测的单词增强,预测任务中差异更大。

ANOVA:任务(理解、预测)*填空(中等,低)

N400时间窗:有任务的主效应,有显著交互作用。填空效应:预测任务显著大于理解任务。振幅没有潜伏期差异,不同任务中N400时间窗没有显著差异。

PNP时间窗:有任务的主效应,有显著交互作用。在2中任务中,不可预测的最后一个词在额电极位产生更大的PNP,但预测任务中差异大于理解任务。

  • 预测准确率的影响:

图2

成功预测,N400振幅降低。控制预测准确性后,N400振幅因上下文支撑而不同,未预测低填空词的N400大于未预测中等填空的词。

PNP:可预测的词最小,未预测的词中等,低填空的词最大。

总之,正确的词汇预测降低了N400和PNP的振幅。

实验1研究理解策略是否可调节词汇加工过程中句子限制的神经效应。

发现和预期加工策略一致,填词可能性的神经效应根据任务不同。在强调主动预测时,N400有更大的语境调节,读者在遇到可预测的词汇后有更大的促进。PNP在预测任务中也有增强,说明当词汇预测不成立时,读者会花费更大的成本。预期策略可以立即影响上下文中可预测和不可预测单词的在线理解这一事实表明,词汇预测的生成至少部分受自上而下的控制。

实验1中发现存在任务的主效应,在预测任务中ERP振幅更大,且ERP差异在中央顶叶电极位最大。这种 ERP 差异很可能是由于在为即将到来的预测判断做准备时,句子最后的词的任务相关性提高了。但是,单相(monophasic)P300 差异无法解释 N400 和 PNP 效应在两项任务中的双相增强。

标准N400填空可能性效应在延迟上没有差异,但是在预测区组中,在预测准确性和上下文支撑效应之间有大的延迟差异。这些延迟效应是正确的词汇预测在 200-300 ms 窗口中产生了促进作用,但预测准确性的独特影响只能通过根据被试的行为反应对试验进行分类来发现。因此,似乎增加了预测任务并不会影响 N400 的整体延迟。相反,激活和选择特定的词汇预测似乎会在 200-300 毫秒的时间窗口内独特地驱动 ERP 差异。

目前实验1的潜在限制:总是先进行理解任务。虽然这种安排对于确保被试不会在实验的后半部分暗中执行预测任务至关重要,但它也增加了跨任务观察到的 ERP 差异可归因于顺序效应的可能性。

  • 对照实验

在实验的第一和第二部分都接受理解任务的指导语。结果发现主要实验中,填空效应大小在比较理解和预测任务时有增强,但对照实验中无显著差异。这些数据表明预测处理在词汇处理的早期阶段具有独特的影响,并且词汇预测机制可以受到自上而下的理解目标的影响。

其他影响因素:句子呈现形式,一个词一个词的呈现,可能会让策略机制有更多的时间来影响理解。因此实验2中采用自定阅读速度来控制策略。确定读者是否可以根据阅读环境的统计规律自然地调节他们的预期加工程度。

被试按照自己的速度来阅读理解句子。其中一些句子包含可预测或不可预测的关键词,这应该会导致总体阅读时间有所不同。实验句不变,filler句子在被试间操纵,以改变整个实验中预测线索的整体有效性。

如果词汇预测是作为前面句子上下文的函数自动生成的,那么所有组都应该对关键句子集中的阅读时间表现出相同的可预测性影响。相反,如果(1)被试对其环境中预测线索的整体有效性敏感,以及(2)他们是否能够战略性地调节他们的预期处理程度,那么可预测性效应的大小应该与遇到正确预测的总体可能性成比例。

252个大学生,平均年龄20.8岁,英语母语。

60个关键词,长度4.9个字符,词频52/百万。

每个关键词在2个不同的句子中,一个是高度可预测,一个完全不可预测。关键词的位置在两个句子框架中保持不变,并且句子在整体词长上匹配。此外,关键词之前的平均两个词(范围 = 1-5)和关键词之后的所有词在两个句子中都是相同的。

180句filler,高度受限。在操纵filler时,改变的词长、词频无显著差异。

对60组句子进行counterbalance,每个被试只看一个关键词1次(30个可预测,30个不可预测)。filler句子分成3组:高有效性(100%可预测),中等有效(50%可预测,50%不可预测),低有效(100%不可预测)

被试被指示使用自定进度的移动窗口范式仔细阅读每个句子以进行理解。在每次试验中,屏幕上都会出现一个句子,所有非空格字符都被一个破折号代替。被试按空格键一次查看句子的一个单词,阅读持续时间被记录为按下按钮之间的时间。在 25% 的句子之后,屏幕上会完整呈现一个对错理解问题,被试会立即收到有关他们回答的反馈。

  • 最大随机效应模型,Barr, Levy, Scheepers, and Tily (2013)

在适当的时候使用反向“最佳路径”算法简化这个模型。可预测性被编码为分类变量,预测有效性被视为连续的、受试者之间的预测因子。在分析之前,这两个因素都以均值为中心。所有报告的 p 值都是通过使用对数似然比检验的模型比较获得的。

  • 阅读时间

理解问题的准确率各组之间没有显著差异。可预测性有主效应,在可预测的上下文中的单词有更快的阅读时间。有效性每一偶主效应,有效性和可预测性之间有显著交互作用。可预测性效应在高有效性组内最大,在中等有效组和低有效组大致线性降低。

图3

1.确定组间差异是由预测环境的促进减少(即减少预激活)还是由于遇到意外延迟的成本减少(即减少再分析)。首先通过计算长度调整后的剩余阅读时间来部分排除被试阅读速度的变化。然后使用长度调整的剩余阅读时间作为因变量来估计两个混合效应模型(分别针对可预测和不可预测的条件)。在不可预测条件下的阅读时间在三个有效性组中基本保持不变(b = 5 ms,t = 0.37,p = .72),而可预测材料的阅读时间随着有效性变得更快的预测线索增加(b = 33 ms,t = 2.3,p = .022)。这表明,随着预测线索变得不那么有效,不同组的可预测性效应的差异是由上下文促进的减少所驱动的。

图4

2.组间差异是由阅读策略的全局转变引起的,还是由对前一次试验的未证实预测的临时适应所驱动的。为了确定局部或全局适应效应是否可以更好地解释这些效应,分析了来自中等有效性组(N = 126)的数据作为可预测性和先前填充语句有效性的函数(有效与无效)。可预测性有显著主效应,到那时没有先前实验的影响。当之前的试验有效 (16.3 ms) 或无效 (19.9 ms) 时,可预测性效应的大小基本上没有变化。这表明被试的阅读行为受到环境的全局统计规律的影响,但不受最近遇到的预测成功或失败的影响。

3.尽管三个有效性组在理解准确性或整体阅读速度(所有成对 ts < 1.2)方面没有显着差异,但我们想验证有效性操作对预测机制有特定影响,而不是对动机或注意力的更普遍影响。为了评估这些频率效应是否也会受到有效性操作的影响,根据中位数分割(高频:百万分之 1545,低频:百万分之 19,每个条件 630 个字)。计算三个有效性组中每个参与者的高频和低频内容词之间的阅读时间差异。【图3B】发现总体频率效应非常显著,但效应的大小在组间没有差异。

说明3组在阅读理解时有相同的主义性和动机,有效性操作对被试的目标预期策略有选择性影响。

在实验 2 中,被试按照自己的节奏阅读句子以进行理解,同时在被试之间操纵遇到已确认或未确认的词汇预测的概率。阅读时间数据表明,读者确实对这些概率线索很敏感。当实验上下文包含大部分具有高度预期结尾的句子时,被试表现出强大的可预测性效果,根据前面的上下文可以预测的关键单词的阅读时间更快。相比之下,在不确定的预测是常态的环境中——预测策略不再有效——这些阅读时间的好处消失了。此外,这种全局背景效应似乎对预测约束的好处有选择性的影响。随着预测效度的提高,这导致在不影响不可预测材料的处理的情况下,对上下文可预测的词有更大的促进作用。

可预测和不可预测的关键项目的词汇内容在各组中保持不变,只有预测的更高层次的战略有效性发生了变化。词汇可预测性效应似乎不是通过传播激活或词汇共现自动产生的;相反,支持性句子上下文提供的好处似乎是由自上而下的理解策略调节的。

  • 句子理解中的自动联想启动

局部一致的主要词可以促进阅读时间和N400的振幅。但这些关联效应有些微弱且短暂,通常会在子句边界上消失(Carroll & Slowiaczek,1986),或者当两个或多个单词介于主语和目标之间时。本研究中的预测语义信息放在句子的较早位置。词汇预测的这种维持成分可能会特别受到战略控制的影响。未来的研究直接操纵预测信息首次可用的时间点(在话语的早期或紧接在关键目标之前)可能有助于解决这个问题。

预期语言加工模型的2个基本问题:1.什么时候生成词汇预测;2.将哪些信息源结合起来以预先激活某些词而不是其他词。

  • 词汇共现

有些词或短语经常一起出现,读者可以更容易的预测后面的词。读者基于上下文计算可能性。

  • 词内传播激活

关联词:医生-护士。虽然关联词在简单的语义启动任务中明显受到促进,但这些影响在理解过程中不太明显,并且可能被来自全局话语的信息或文本的消息级表示所推翻。

单独的单词共现和自动词汇关联并不能解释预测效果的完整模式。如果读者遇到大量的预测错误,他们可能会开始从预期的处理策略转移,转而更加强调自下而上的刺激评估。

Huettig (2015)不同路径的分析可能性,认为语言预测时使用多种路径生成的。模型中,Type1:自动、快速加工,例如传播激活、词汇共现。Type2:缓慢、策略加工。该模型假设这两条处理路线没有被封装,但可以实时交互以动态调节多个候选词的激活。

本研究主要强调句子加工中Type2机制的重要性。实验2的结果说明策略机制减少上下文中可预测单词的阅读时间。但是自定阅读速度和连续视觉呈现只是和正常的阅读速度粗略近似,未来研究中使用其他范式和相关测量来复制本研究。

词汇预测的神经指标可能对自动和策略启动有不同的敏感性,且可能对不同的呈现形式有不同的敏感性。

最后,本研究的结果还为词汇预测失败后产生的潜在成本提供了间接证据。如果生成不正确的词汇预测是免费的,那么就没有动力来调整预测策略以响应周围的语言环境。使用免费系统,即使很少遇到这些预期的词,读者也应该继续生成强大的词法预测(在这种情况下,一些词法预测总比没有好)。读者在预测效度低的情况下降低他们的预期加工水平这一事实表明词汇预测确实需要一些成本,并且有时预期加工的成本效益比可能变得不利。

2.不足之处和未来研究方向 ¶

1.最大随机效应模型,Barr, Levy, Scheepers, and Tily (2013)

2.不同表征水平(语义、语音、句法)的预激活可能对自上而下策略有不同的敏感性。

3.在预测时,生成、维护、验证/修正,哪一个成本最高?如果词汇预测在指导读者行为表现上起关键作用,那么应研究这些成本何时、如何操作的。