句子和语篇水平的预测有区别



论文信息 ¶

Chang, R., Yang, X., & Yang, Y. (2020). Prediction differs at sentence and discourse level: An event-related potential study. Applied Psycholinguistics, 41(4), 797-815. doi:10.1017/s0142716420000235

论文原文 ¶

关键词 ¶

预测;N400;PNP

摘要 ¶

本研究使用ERP研究了当上下文信息来自immediatelt preceding sentence context和来自earlier discourse context时,预测即将到来的单词的差异。四句话的语篇被呈现给被试,关键词在最后一句话中,根据句子或者语篇层面的信息,关键词可以预测/不可预测。在句子层面,预测的关键语境信息由最后一句话提供,其中嵌入了关键词。(例如,小宇来到了卧室;她做了一杯柠檬茶;然后她坐在椅子上,打开了盒子/相册来欣赏照片)。而在语篇层面,关键信息由第一句话提供(例如,小宇打开了盒子/相册;她做了一杯柠檬茶;然后她坐在椅子上;她悠闲地欣赏照片)。结果显示,在句子和语篇两个层面上,与不可预测词相比,可预测词的N400效应降低,并且在句子水平上也存在N400之后的PNP效应。这表明句子和语篇层面的语义信息都有助于读者预测即将到来的单词,但句子语境比语篇语境更有助于预测。

引言 ¶

在语言理解过程中,各种时间尺度上的先前信息都可以用来预测即将到来的单词。然而,当用于产生预测的上下文信息是来自于紧随其前的句子上下文时(例如,小宇来到了卧室;她做了一杯柠檬茶;然后她坐在椅子上,打开了盒子/相册来欣赏照片),或是来自较早的语篇语境时(例如,小宇打开了盒子/相册;她做了一杯柠檬茶;然后她坐在椅子上;她悠闲地欣赏照片),预测是否不同或者怎么不同仍不清楚。当前研究主要研究这个问题。 已经有研究表明,对即将到来的单词的预测不仅可以基于局部句子语境,还可以基于全局的语篇语境。EEG研究中,与较难预测或不可预测的单词相比,可预测的单词与N400幅度降低的关联更大。值得注意的是,预测的N400效应可能不仅反应了预测处理,还可能反应了预测和整合两个过程的组合。 虽然N400效应一直被观察到在句子和语篇语境中对即将到来的单词的预测,但据报道,PNP效应主要在句子语境中对预测加工敏感。例如。Van Petten(2012)发现,在句子语境中,不可预测的词比可预测的词引起了更大的PNP,这表明这种前部的正性对于即将到来的词的预测是敏感的。尽管有这种发现,但是这种前部的PNP的确切功能依然存在争议。一种观点认为:这种PNP可能和抑制预测单词的成本有关。另一种观点认为这种PNP可能与在不可预测的信息之后对信息和/或语篇级别信息的修订有关。在语言加工的过程中,与语义一致的词相比,语义不一致的词一直存在着更广泛的PNP,这种PNP被认为反映了整合的成本,此外,许多研究人员认为,与语义不一致相关的PNP可能与领域一般过程有关。 虽然与预测有关的前额叶正性在句子层面中经常被报道,但是只有少数的语篇层面的研究中才能看到这种情况。根据这些发现,句子和语篇层面的语境可能会以不同的方式影响对即将到来的单词的预测。 语言处理是递增的:对即将到来的单词的预测可以在随着时间的推移展开的先前上下文的基础上在各种表征水平上形成。根据基于记忆的语言理解的观点,语境信息在工作记忆中并不是无限期地保持完全激活的状态,而是随着语言的展开而逐渐衰退。基于这种观点,由于工作记忆中记忆痕迹的下降,(较新)的句子水平的信息可能会比(不那么新)的语篇水平的信息对语言预测产生更强的影响。 然而,也有研究表明,全局的语境比局部语境能够产生更大的影响,根据这些研究,语篇层面的信息比句子层面的信息在更大程度上有助于对即将到来的单词的预测也是可能的。事实上,在之前的一项研究中已经观察到了这一点(这里的实验显示了全局可预测但局部不一致的单词,比全局不可预测但局部一致的单词的N400更小,所以全局信息可能比局部信息具有更强的影响。然而在这个研究中,句子语境提供了目标名词的典型或者非典型特征,而语篇语境既提供了语义层面的信息,也提供了故事情节,这对语篇理解可能比语义信息更重要。同时,该研究中,目标词的可预测性主要是由全局语篇语境决定,而不是由局部句子语境决定,即使局部句子语境包含特征词,全局语篇语境也可能不会使目标词非常可预测。因此这种句子水平和语篇水平的信息如何影响预测,值得进一步探索。 本实验使用ERP,考察句子和语篇语境对新词预测的影响。语篇总共四句话,关键词位于最后一句话。对于句子层面,关键信息由篇章的最后一句提供,而对语篇层面,由第一句话提供,关键词要么是可预测的,要么是不可预测的。句子和语篇条件的唯一区别就是关键词和之前的语境之间的距离。总共构建了四个条件:句子水平可预测、句子水平不可预测、语篇水平可预测、语篇水平不可预测。 作者认为,预测即将到来的单词的神经认知过程将与确认预测的好处和不确认预测的成本相联系,这将分别反映在N400和前额叶PNP中。根据先前研究,作者假设,句子水平和语篇水平的支持性语境都有利于对可预测词的语义加工,这可能导致两种条件下可预测词的N400都小于不可预测词的N400。此外,不可预测的单词可能会导致对预测词汇的抑制或信息/语篇信息的修订,这将反映在前额叶PNP上。如果由于衰退的语境记忆,句子语境比语篇语境对目标词的预测有更强的影响,那么在句子条件下会比语篇条件下观察到更大的额叶PNP,反之。

当前研究 ¶

  1. 被试 24个大学生,汉语母语者。2个女性被试的数据因为为营过多被排除在统计分析外。
  2. 实验材料 总共使用了120套语篇。每套语篇由四句话组成,所有实验条件下,关键词都是放在最后一句,第一句话被操纵为语篇语境。第四句关键词之前的内容被操纵为句子语境。基于先前的句子/语篇语境,关键词要么是可预测的,要么不可预测。第二句和第三句在各个条件下都是一样的。根据拉丁方设计,120套语篇被安排成了四个list,每个list包含每种条件下30个语篇以确保每个语篇只被呈现一次。还增加了90个不一致的语篇作为filler:20个最后一句语义违反,20个第一句和最后一句之间语义违反,50个第二句和第三句中语义违反。因此,不一致的信息在四个句子中大致相等地呈现出来,以使得被试平等地注意到每一句话。 然后找了40个母语者来做完型填空测试,每个被试只做一个list。以语境(2个水平)和关键词的可预测性(2个水平)为自变量,完型填空概率为因变量,进行重复测量方差分析。结果表明,可预测性的主效应显著,表明可预测词的完型填空概率高于不可预测词。研究结果并未显示语境的显著主效应或者交互作用。使用完型填空概率,计算出了语篇的约束度,重复测量方差分析显示出了可预测性的显著主效应。 另外又找了24个大学生,以7分制对语篇的可接受性进行评分,所有条件都被评为可接受的,结果显示出了可预测性的主效应,表明可预测条件比不可预测条件更可接受。结果也表明了没有语境的主效应和交互作用。表明可接受度和语境的类型无关,只与预测性有关。
  3. 程序 210个语篇伪随机呈现给被试。每次开始时,屏幕中一个1000ms十字,然后逐句呈现前三句话,被试需要在读完句子之后按下空格键。最后一个句子逐词呈现,每个词出现400ms,随后是300ms的刺激间隔。为了确保被试认真阅读,1/3的语篇后面都有理解问题:被试需要按要求按键,所有材料分为了6个block。
  4. EEG记录和处理 64个电极,采样频率500Hz,放大器0.05—100HZ。左乳突作为在线参考,而左右乳突平均值作为离线再参考。放置了垂直和水平眼电。眼电的伪影被自动校准。数据用0.1-30HZ的滤波器离线滤波。关键期是从关键词出现前的200ms到出现后的1000ms,基线为-200ms到0ms,进行了伪影排除程序。
  5. 数据分析 基于目测和先前的研究,N400和PNP的时间窗口被确定为300-500ms以及500-700ms。以语境(2水平)和可预测性(2水平)、半球(左、中、右)、区域(额叶、中央、顶叶)为变量进行重复测量方差分析。因此建立了9个感兴趣区域,每个包含了5-6个电极:也就是上面的3×3。作者只报告了涉及实验条件的显著。所以显著的交互作用都要再进行简单的效果测试。

结果 ¶

  1. 行为学结果 问题的平均正确率是96.05%,说明被试认真阅读了语篇。平均正确率在四个条件下相当。
  2. ERP结果

    2023-09-10-YXY-Fig1

    ANOVA结果如上图所示。结果显示在300-500ms内的显著的可预测性的主效应,表明可预测的单词相对于不可预测的词降低了N400幅度。可预测性和区域之间存在着显著的交互作用。一个简单的效应分析表明,可预测性的影响在三种区域水平上都有,但最显著的是中央和顶叶区域。可预测性和半球之间也存在着明显的交互作用,简单的效应分析表明,在三个半球水平上都有可预测性的影响。语境条件和区域之间也存在着交互作用,简单的效应分析表明,语境的影响只在额叶处存在,与句子条件相比,语篇条件下的词表现出较低的N400波幅。此外,还发现了语境和大脑半球之间存在显著的交互效应,简单的分析表明,语境的影响只在右脑获得,与句子条件下的词相比,语篇条件下的词表现出较低的N400幅度。语境和可预测性之间没有显著的交互作用,说明句子和语篇条件下的N400效应没有显著差异。 在500-700ms窗口内,观察到了显著的语境主效应,表明语篇条件下的词比句子条件下的词产生了更多的正性波。同时,有语境和区域之间的交互作用,简单的效果分析表明,语境的影响主要集中在前额和中央区域。更重要的是,研究揭示了语境和可预测性之间的显著交互作用,以及语境×可预测性×半球之间的交互作用。通过分别分析语境条件来分割这个3way交互作用。对于句子层面,以可预测性和半球为因素的方差分析显示,可预测性有显著的主效应,可预测性和半球之间存在交互作用,不可预测的词在左和中间区域比可预测词引起更多的正向波。在语篇层面,什么效应都没发现。表明了语篇水平不存在没有PNP。总体而言,仅在句子条件下观察到了左半球和中间的PNP,而在语篇条件下没有观察到。

讨论 ¶

该研究的目的是考察句子和语篇语境中的某些因素对目标词预测的影响。结果显示,在两种语境条件下,可预测的词都比不可预测的词的N400幅度更低。此外,在句子条件下,不可预测词出现了PNP效应,而在语篇条件下没有,这些结果表明,在句子层面和语篇层面上的预测效果确实不同。

  1. 预测的效应 本实验中,与不可预测的词相比,可预测词在句子和语篇条件下的N400都有所降低,这一效应广泛地分布在头皮上,最显著地是中央和顶叶区域,与经典地N400效应地头皮分布相似。N400被认为反映了从语义长时记忆中激活与单词相关地意义的难易程度,支持性的语义语境可以促进这一过程。研究结果表明了两种语境都可以用来产生预测,当预测被证实时,被发现能够立即促进预测词的语义加工。需要注意的是,依赖于可预测性的N400本身并不是实际预测的强有力证据。本研究中的N400效应可能不仅仅反映了对即将到来的单词的预测。 有趣的是,在N400之后也观察到了PNP效应。在句子条件下,不可预测的词比可预测的词产生了更大的PNP效应;但在语篇条件下,这种效应完全消失。在句子条件下,这种PNP分布在左侧和中间电极。之前的实验中,观察到了两种类型的PNP:1. 与语义一致的词相比,语义不一致的词具有更大的正性和更多的后部分布。2. 与可预测的词相比,语义一致但不可预测的词也会有PNP,但这种影响主要分布在更前部的区域,或者是左侧化的。本研究中使用的不可预测词汇也是语义上和谐的,并且不可预测词也引起了PNP,这种PNP可能和上面说的前部的正性类似。然而,统计分析并没有显示出明确的前部分布,另一种解释是,这种PNP可能是更广泛分布的PNP,可能反映了目标词和先前语境之间更常见的整合过程。
  2. 语境条件的影响 语境的操纵并没有显示处对N400效应的调制。基于N400结果,在句子和语篇水平下都生成了语义预测,并且当呈现的信息与语义预测匹配时,两种条件下都相对地促进了语义处理。这里,句子和语篇条件之间地无差别N400效应可以表明两个语境都可以同等地促进对可预测单词地语义处理。 这种结果显示,当完型填空概率和词的可接受性能很好地匹配时,这两种语境对语义加工的影响相似。这个结果就和之前的研究不一致,之前的研究发现更广泛的语篇语境优于句子语境。结果的差异可能归因于三个因素:1. 之前的研究中语篇语境提供了故事情节,可能比词汇语义信息对预测的影响更大,而本实验中句子和语篇条件包含相似的特定词汇信息。2.之前研究中,句子和语篇的完型填空概率不匹配,而本研究中是匹配的。3. 之前实验使用的是言语,而本研究中使用的是书面刺激。 本研究采用的是700ms间隔(SOA),然而呈现速度也会对预测有重大影响。于使用较短的实验相比,700ms的SOA可能会有更多的时间来生成预测,从而使更具体地预测受益。根据这个,作者使用的呈现速度可能会允许读者预测更具体的信息,如词汇项或特定的拼写形式。呈现速度如何影响/是否影响句子和语篇语境中的预测,值得进一步探讨。 同时,本研究还发现语境条件调节了PNP,这种PNP只存在于句子条件下,而不存在于话语条件中,这种差异表明,PNP反应了和N400不同的认知过程,N400对上下文信息更敏感。根据抑制的观点,当输入和读者的预测不匹配时,预测的信息需要被抑制,并且这种反映在前额叶的正性上。然而这个说法在本实验中可能站不住脚,因为在语篇语境/可预测的条件下观察到了更大的PNP,其中没有单词需要被抑制。 根据修订观点,当遇到的输入不确定预测的单词时,语言理解系统修改当前的语篇表示,导致了句子条件中增强的PNP,有鉴于此,研究中观察到的PNP可能与修订的过程有关。但结果中,“离群值”是句子/可预测条件,除了句子/可预测条件外,所有其他的条件都有增强的PNP,包括语篇/可预测条件,因此结果似乎与修订解释也不相容 鉴于结果显示这个PNP是广泛分布的,而不是前额叶分布的PNP,而且除了句子/可预测条件之外,所有的其他条件都有增强的PNP。作者认为,这可能反映了即将到来的单词更常见地整合到先前地语境中的过程,这个过程可能会受到语境的调节。在句子条件下,与可预测词相比,不可预测词更难整合到先前的语境中,导致不可预测词比可预测词有更大的PNP。然而,在语篇条件下,相关语境呈现地更早,根据相关背景信息来解释目标词的认知成本更高,导致对预测词和不可预测词的PNP都有所增高。也就是说,虽然整合即将到来的单词可以从晚些时候呈现的详细语义信息中收益,但在句子语境中,如果相关信息在语篇语境中呈现得更早,这种好处也可能大大减少。 最近一项大型研究发现,可预测性得PNP效应得一部分可以用语义相似性来解释,此外,与距离较远的关系相比,语义相似效应更可能发生在看起来很近的单词上。因此,也不能排除,在句子条件下观察到的可预测性的PNP至少部分是由于语义相似效应,未来有待研究。 还有一种可能性,那就是结果可能反映了句子和语篇语境中的关键词和前面信息之间的启动效应,然而,鉴于启动效应不会导致两个句子条件下的PNP有任何差异,可以推断,不仅反映了启动效应,也反映了目标词在句子和语篇水平上的预测差异。 该结果支持,对即将到来的单词的预测更多收益于句子上下文而非语篇上下文,与先前的研究一致。虽然这些研究没有直接研究预测的认知过程,但它们确实表明,在语篇语境中,读者需要更多的认知努力来整合长距离信息,而不是短距离信息。 总之,研究结果表明,句子和语篇语境都允许读者预测即将到来的单词,支持性句子和语篇语境可以促进对可预测单词的语义加工。更重要的,基于句子语境的预测比基于语篇语境的预测对加工有更大的促进作用,研究结果表明,在语篇加工过程中考虑预测时,能够提供预测的关键的语境信息的位置应该被纳入考虑范围!