语言加工预测的4个核心问题



文献:Huettig, F. (2015). Four central questions about prediction in language processing. Brain Research, 1626, 118–135. http://dx.doi.org/10.1016/j.brainres.2015.02.014

原文

1.文章概述 ¶

传统观点:语言学家对预测对语言处理的根本影响持相当悲观的态度。许多语言学家认为,预测在语言理解过程中只起次要作用,因为遇到每个单词时都有很大的可能性。

但是如果预测是人类认知的核心特征,那么他也应该是人类语言吃力的核心特征。

很多心理语言学实验结果发现语言处理轻松、准确、高效的原因之一是成熟发展的对语言输入的预测。相关观点:

1.Federmeier and Kutas (1999):在处理一个句子的过程中,理解系统参与了一些相当于预测的过程。

2.Pickering and Garrod (2013):预测在语言产生、理解和对话中的核心作用。

3.Chang et al. (2006) :”学习发生是因为预测发生了”,因此“句法抽象来自学习者的默认预测“

4.Altmann and Mirković (2009):“跨时间预测是事件结构出现的关键”,“因此,预测最有可能具有遍及皮层功能的神经基础”。

为了评估这样的说法,本文作者认为提出和回答关于预测语言处理的四个核心问题是有用的。why(即语言处理中预测的功能是什么);what(即用于预测即将到来的语言信息的线索是什么以及预测的是什么类型的表征);How(预测语言处理涉及哪些机制以及可能的中介因素(例如工作记忆)的作用是什么;when(个体是否总是会预测语言?)

2.why ¶

预测在语言处理中有许多明显的潜在好处。预测可以加快处理速度并提高心理操作的效率。它可以减少大多数语言表达中固有的歧义,从而减少记忆负荷。然而,关于预测在语言处理中的功能还有一些更基本的论点。

人类语言最显着的特征之一是语言使用者可以理解和产生无限多的他们以前从未体验过的短语和句子。语言学家认为,语言使用者无法在大脑中存储所有可能的话语;他们必须根据快速使用的结构原则构建话语。是一种循环网络。

学习是由于简单的循环网络检测预测依赖性的能力而发生的。Saffran 认为预测依赖(例如 the 或 a 通常后跟名词)允许语言学习者获得抽象结构。她认为语言学习者会检测到语言短语结构中的依赖关系,并用于建立聚集成短语的单词序列。而提取统计规律的能力被认为与个人的预测技能有关。

但是,提取前向统计规律的能力并不一定能告诉我们这些结果在多大程度上受预测驱动。重要的是,语言学习不一定要涉及预测。例如,德语中后向转移概率(backward transitional probabilities)比前向统计提供更多的信息,英语中名词这一类别的学习也是如此。这些发现表明“后述”同样(甚至更)重要,预测对于语言学习(以及更普遍的语言处理)绝对必要的说法提出了严重的怀疑。

预期语言处理的另一个关键功能可能是促进相互理解或将对话作为一项联合活动进行协调(参见 Clark,1996)。

Scottetal.(2009) 提出在对话期间,大脑的颞叶和相关区域会跟踪所说内容的含义,同时运动系统会跟踪说话者的语速和节奏,以确保有效的语轮交替。这些相关论点都限制在严格的上下文中,而上下文更容易完成对话。

Clark (2013) 认为,面向行动的预测处理框架的最大价值在于它提出了一套深度统一的原则,用于我们从神经功能和组织方面理解人类思维。

弗里斯顿 (2010) 声称大脑从根本上从事预测编码并计算精确的预测误差,这些误差偏向于做出正确的推断。他认为,预测编码通过皮层层级之间的反复或相互交互使预测误差最小化。

3.what ¶

关于“what”,有两个重要问题。第一个问题涉及用于预测的线索:哪些类型的信息用于预测即将出现的单词?第二个涉及预测的内容:激活了哪些类型的表示?

1.连接言语的规律:处理可预测的单词会比不可预测的单词快,比如看见“either”会预测“or”。

2.时间线索:个人能够使用时间线索进行语言生成的发现告诉我们他们实际上使用这些规律进行预测的程度。

使用不同类型的方法积累了更多关于语言处理中用于预测的线索的直接证据,最重要的是阅读过程中的眼动追踪、电生理研究和视觉情境眼动追踪。

McDonald and Shillcock (2003)的眼动任务证明单词预测注视持续时间之间的转换概率,读者在预测单词时会使用转换概率和共现统计。他们的研究结果认为语义可能性为注视时间提供了解释。但是Frisson et al. (2005)在填空任务中复制了McDonald and Shillcock的研究,发现当项目与完形填空值匹配时,没有发现转移概率的影响。因此,这一发现对读者在阅读过程中跟踪转换概率以预测即将出现的单词的解释产生了怀疑。

ERP N400:已有研究表明N400是语义加工的敏感性指标,当词与预期词相关时(例如,“pines”)相对于不相关时(例如,“tulips”),N400 幅度对意外词的幅度会减弱。这表明语义类别信息已根据句子上下文预先激活(即预测)。很多研究研究呈现在独立句子中的预测性语言加工,Van Berkum等人发现对于与话语可预测名词不一致的形容词相对于与话语可预测名词一致的形容词而言,N400 效应增强。这些发现表明人们还使用更广泛的话语上下文来预测即将到来的语言信息。

眼动研究发现听众可以使用多种类型的特定线索进行预测,包括语格标记,韵律和视觉呈现。

电生理学研究还提供了一些关于在预测语言处理过程中激活哪些类型的表征的证据。语言使用者可以预激活语义/概念特征、形态句法特征、语音形式和正字法。

视觉情境眼动研究也证明了语言使用者的预测内容包括语义信息。但是语义是语言理解至关重要的信息,如果说预测是基本原理,那么应该可以预测相对不那么重要的信息。Rommers et al. (2013)研究听者是否可以激活单词所指对象的形状。相比不相关的形状,相关的形状发现了显著减弱的N400振幅。因此,听者似乎在话语中提及对象之前激活了对象的感知属性。更一般地说,这些数据(即预测概念级联到存储的视觉形式级别的预激活)可以被解释为符合预测是语言处理的基本原则的概念。但是Rommers 等人的形状预测研究效果相对于目标预测效果来说相当小。需要进一步研究探索语言处理过程中不同类型心理表征的预激活程度。

4.how ¶

在过去的 15-20 年中,大多数关于预测性语言处理的研究都集中在证明预测是语言处理的重要组成部分。很少有研究针对建立预期语言处理的机制和中介因素。然而,近年来研究人员开始更直接地研究这个关键主题。

评估不同预测机制的重要前提是准确定义预测。本文作者认为“语言处理中的预测是:在语言理解者遇到语言输入之前对语言输入进行预激活/检索。”一个重要(但有争议)的问题是启动是否应该被视为预测的一部分。

两种情况:

  1. 相关信息在之前出现,促进单词的识别。

  2. 没有启动的情况下,有预激活。

这两种情况说明在讨论语言输入的预激活/检索机制时,不能(或至少不应该)避免考虑启动的影响。

近年来,人类大脑利用两个(至少部分)不同系统的观点得到了很多支持。 Kahneman (2011) (cf. Stanovich and West, 2000) 将系统 1 描述为“自动且快速地运行,几乎不需要努力,也没有自愿控制的感觉”。另一方面,系统 2 被假定为“将注意力分配到需要它的费力的心理活动上,包括复杂的计算。系统 2 的操作通常与能动性、选择和专注的主观体验有关”。

Kahneman 的系统 1 和 2 可以连接到不同的预测语言处理路线。系统 1 是预测的“愚蠢”途径:简单的关联机制(例如基于 Hebbian 学习)导致语言输入的预激活。系统 2 是预测的“智能”途径,并与更费力的主动推理相关联。

Kuperberg (2007) 将N400和P600联系起来,第一条通路类似系统1,N400对词汇语义敏感。第二条通路类似系统2,涉及“通过算法机制组合单词以建立高阶含义”,并且 P600 ERP 组件反映了该组合系统内的持续分析。

语义启动研究表明颞叶和下前额叶区域对联想关系敏感。相同的大脑区域(在 fMRI 研究中)似乎因 ERP 研究中引起 N400 的语义不协调而被激活。相比之下,系统 2 被认为涉及后下额叶皮层、运动和顶叶皮层以及中上和上前额叶皮层。这些区域似乎被形态句法违规和语义主题违规(并唤起 P600)激活,这与系统 2 是“组合流”的想法一致,对多种语言约束和高阶意义的构建很敏感。

目前神经系统的许多功能尚不清楚,很多建议都是推测性的。系统 1(例如基于 Hebbian 学习)的神经机制的证据似乎比更复杂的系统 2 的神经机制更直接。然而,目前几乎没有具体的证据支持这种说法。同样重要的是要注意,虽然系统 1 和 2 部分不同,但它们被认为是不断相互作用的。

Altmannand Mirkovica 不仅假设语言预测基于单一系统,而且认为语言预测和非语言预测之间没有区别。他们认为具有共享隐藏单元的简单循环(连接)网络(Elman,1990)可以学习语言和非语言的偶然性,从而在没有任何明确的语言表示级别的情况下进行预测。单一系统的预测类似于感知和行动中的常见编码方法(例如,Prinz,1990),并与其中话语意义、场景信息和语言期望的独立表示通过过程相关的帐户进行对比(例如共索引)。

相关证据:个体在语言预测和非语言预测任务中的预测倾向的正相关至少与共享系统一致。眼动研究中对干扰项的注视概率与预期注意力的个体差异系统有关。预测箭头提示最能促进被试反应,注视概率和词汇量、语言流畅度相关,语言和非语言因素对不同类型的预测处理机制有贡献。因此,可以说,这些发现与两个系统或多个系统的一致性比语言处理中的预测的一个系统更一致,尽管需要进一步研究以更仔细地研究这个问题。

单一系统解释通常认为事件知识在预测行语言加工中有重要作用。事件往往会再次发生并表现出规律性,因此很可能是过去经验的重要组织原则。Metusalem et al. (2012)研究在在线语言处理过程中是否可以立即访问事件知识以及预测语言处理的主要决定因素。发现与所描述事件无关的同样异常的词相比,与所描述事件相关的上下文异常词N400 的振幅降低。因此认为事件知识驱动预测行语言加工。

但是因为启动基于与过去经验相似的轨迹,主动预测可能是系统遵循特定轨迹的结果。

使用语言生成系统来预测语言输入。

  • 支持证据:
  1. Chang(2006)提出了意义和顺序的双路径模型。这两个系统会聚在一个单词输出层上,以确保生成与预期消息一致的单词的正确时机。假设意义系统涉及概念和事件角色的绑定。排序系统是一种基于错误的学习机制。重要的是,产生句子所需的句法抽象来自学习者对即将出现的单词的预测。因此,当模型的基于生产的预测与其他人产生的产品进行比较时,就会发生学习。

  2. Pickering and Garrod (2013)认为语言使用者的向前产出模型和动作发出者的向前行动模型类似。说话者构建他们预测产出的效果,并和其他输出者的产出相比较。听者也使用前向产出模型,模仿说话者预测说话者要说的话。他们认为模拟预测路线是由关联路线补充的,该路线基于在语言用户对其他人话语的体验中被说出的概率。生产过程中使用的模块信息用于预测理解过程中即将到来的语言输入。

  3. 多项研究表明,在听语音时,关节肌是活跃的,但在听非语音声音时则不然。但是在言语感知中激活运动皮层的证据并不能证明运动系统必然参与生成预测。

  4. Kara Federmeier:半球差异。人们早就知道左半球大脑区域的损伤会导致许多语言功能的严重缺陷,而类似的右半球区域的损伤似乎会使大部分语言处理功能完好无损。语言不对称在语言生产中最为明显。关于大脑功能半球不对称的电生理学证据得出的结论是,左半球偏向于预测处理,而右半球偏向于自下而上的处理。她进一步认为,这种左半球预测偏差的出现是因为反馈连接在左半球加工中发挥着更大的作用,因为理解和生产仅在这个半球共享资源。

  5. 视觉情境范式:Mani and Huettig (2012)向2岁儿童呈现成人产出的句子和对应的图片,幼儿的预期注视与他们的生产性词汇量显着相关。生产词汇量大的儿童而不是生产词汇量小的儿童预期目标对象。这些数据表明,基于产生的预测机制可能在早期语言发展中很重要。

  6. 小脑参与基于产出的预测的可能性。一些高阶的言语产出缺陷往往发生在小脑病变患者中。

  • 反对证据:

Drake and Corley (2015) 发现在三个图片命名实验中,当图片名称与预测词在语音上重叠时,图片命名延迟不会受到影响。这些数据表明,如果生产系统涉及预测语言处理,它可能不涉及语音表示的声音级别。

  • 总结:基于生产的方法提出了一种有趣的替代性预测语言处理机制。它们也很自然地适合感知和行动研究中的预测编码帐户,因为语言理解可以被视为一种行动感知形式,语言产出被视为动作形式。回顾的研究强调,到目前为止,生产系统参与预测的实验证据相当间接,而且总体上相对稀少。然而,这是预期的,因为基于生产的预测方法相对较新。

本文作者认为即使是两个系统的解释也不能正确处理预期语言处理的复杂性(参见 Mani 和 Huettig,2013)。他认为的思想/大脑采用许多不同的机制/策略,导致语言输入的预激活/检索。提出四种机制(PACS:基于产生、关联、组合和模拟的预测),认为对于预测性语言处理的全面说明,它们是最低要求的。

  1. 理解者有时使用他们的语言生成系统来预测另一个人可能会说的话。但是与 Pickering 和 Garrod (2013) 的理论不同,作者假设人们为此使用他们成熟的生产系统,而不是使用前向模型。换句话说,他认为人经常在“头脑中”完成他人话语的经验是基于完全指定的生产表示,而不是前向模型的贫乏的生产表示。

  2. 同系统1,即将到来的输入由简单的关联机制(这很可能基于 Hebbian 学习)预先激活。有大量证据表明,这种启动不仅限于语义知识,还涉及语音、拼写甚至非语言信息。

  3. 同系统2,有证据表明,语言输入通过对多种语言约束敏感的组合机制和高阶意义的建立来预激活这。些组合机制是否涉及部分独立的语言理解和语言生成系统的问题仍有待回答。

  4. 可以通过事件模拟来激活语言输入。 Tversky 和 ​​Kahneman (1973)提出,人们通过模拟事件的难易程度来预测即将发生的事件的可能性。作者认为我们经常使用这种事件模拟启发式来预激活语言表示。这个提议与通常被称为具身语言处理(embodied language processing)的观点相联系。但是作者认为我们经常使用心理意象来感知模拟事件,此类事件模拟在预测中发挥重要作用,因为它们预先激活了语言表征。

作者认为PACS(基于生产、关联、组合和模拟的预测)机制,对于预测性语言处理的全面说明是最低要求的。这些不同机制之间关系的本质是不断相互关联和相互作用的。例如,联想启动导致(更快)检索相关表示/单词,这些表示/单词可以由组合机制使用。生产系统使用这些组合机制,但至关重要的是,语言生产不仅仅是顺序组合操作(最有可能在生产和理解之间共享)。他推测上下文为使用成熟的生产系统进行预测提供了触发因素(例如,当人们完成彼此的话语时),即基于组合机制扩大预测以完全-成熟的基于生产的预测。作者认为关联机制对于连接不同的 PACS 机制也很重要。事件模拟可能触发特定事件类型和特定表征/单词/句法结构之间的关系。事件模拟更有可能在自然对话期间发生,从而在事件模拟和基于生产的预测之间提供可能的关联链接。请注意,有时不同 PACS 机制的输出会发生冲突(例如,如果关联机制将眼睛注视到一个视觉对象,将组合机制驱动到另一个,参见 Kukona 等,2011)。因此,涉及 PACS 机制的理解过程的结果在很大程度上取决于(语言和非语言)上下文(参见句子处理的约束满足方法,例如 MacDonald 等,1994)。显然,需要更多的研究来评估 PACS 机制的相互作用和整合。迄今为止,很少有研究直接对比语言处理中假设的预测机制。未来的研究可以重点关注这些机制的整合和相互作用。在已实现的计算模型中研究这些相互作用也是可取的。

  • 为什么使用多种机制?
  1. 通过利用多种途径/机制来预激活即将到来的输入,对于可以预测即将到来的语言输入的思想可能具有进化优势。与在每种情况下采用相同旧策略的思维相比,这种思维可能能够更快地得出行为后果。

  2. 很可能没有进化上的好处。进化没有任何意义。预测语言处理中的多种机制的参与可能只是反映了进化史。一些机制可能在进化上更古老(例如简单的关联机制);其他(例如,涉及更主动预测的组合机制)可能是最近的。一些导致语言输入的预激活/检索的机制可能是为其他目的而进化的机制的副产品。

对于语言处理中预测的“为什么问题”,可能没有简单的答案。鉴于我们目前对人类思维的神经生物学基础的了解,对“为什么问题”的任何回答都或多或少是推测性的。

工作记忆和一般认知效率等语言处理过程中可能介导预测的因素的重要性几乎没有被研究过。此外,这些中介因素的影响也可能依赖于语境,并取决于语言使用者所处的情境。例如,视觉世界中以语言为中介的预期眼睛注视需要将视觉对象与展开的语言信息联系起来、地点、时间和彼此。认知能力(例如工作记忆)的个体差异对于此类语言-视觉交互过程中的预期处理可能特别重要。

视觉情境范式研究:增强的工作记忆能力支持预期的口语处理,而一般处理速度的降低则具有相反的效果。

工作记忆如何影响语言介导的预期眼球运动?工作记忆将长期的视觉和语言表征与特定位置联系起来。这个解释预测工作记忆容量在语言介导的预期眼球运动中起着重要作用。视觉情境眼动追踪研究中视觉显示中的对象被假定首先在视觉空间类型的工作记忆中编码,这会触发长期记忆中的感知假设。这些视觉表征的激活然后在几百毫秒内级联到“更高”级别的表征。因此,对象知识和相关的语言知识(例如,对象名称的性别表示)与对象在工作记忆中的位置相关联。类似的事件链由语言输入(例如,在口语教学中听到文章)触发,相关表示(例如,语音、句法)将与视觉输入激活的表示相匹配。特定表示的激活强度转化为参与这些表示的任何内容的概率。因此,更好的工作记忆能力导致更有效的预期眼睛注视。

Huettig and Janse (2012)发现信息处理速度的个体差异对预测性语言处理起着重要作用。处理速度与神经信号沿轴突传导的速度有关。此外,神经传递速度与髓鞘形成程度有关。这种潜在的处理速度和认知效率背后的神经机制需要进一步研究。

工作记忆和处理速度对预期口语处理的影响在特定情境中可能特别强,例如,当口语与共同存在的视觉环境相关时。这当然适用于人们发出或接收行动指示或谈论现实世界事件的许多日常情况。然而,不同认知能力的个体差异对其他情况下的预期口语加工的影响仍有待探索。预测语言处理模型必须进行修改,以将工作记忆和处理速度等中介因素考虑在内。

年龄会影响预测语言加工。

Rayner et al. (2006, 2009)发现与年轻的成年读者相比,年长的读者采用风险更高的阅读策略。他们发现年长的读者更经常跳过单词,这可以解释为表明老年人比年轻人预测更多,以弥补与年龄相关的认知能力下降。

相比年轻人,老年人由于经验,会是更高级的语言使用者,但这种优势可能常常被与年龄相关的认知能力下降所掩盖。未来的研究可以进一步探索这种可能性。

对于许多人类能力而言,预测与手头任务的专业知识水平有着根本的联系。最近的一些研究还提供了强有力的证据,证明语言能力(即阅读水平)和预测(即预期口语处理)之间存在联系。

预测性语言处理受许多个体差异的影响。工作记忆和处理速度/认知效率、年龄和识字率都被发现可以调节预期口语处理。到目前为止,我们对这些中介因素如何相互影响以及它们如何与上述预测语言处理机制相互作用知之甚少。然而,预测语言处理的理论模型只有在它们能够解释多种机制和多种中介因素的复杂相互作用时才会完整。

5.when ¶

什么时候加工是一个很重要的问题,因为与预测是否是人类信息加工的基本原则有关。人类是否总是进行预测?

目前研究大多使用填空任务,而日常生活中听到的句子的可预测性要差的多。我们对语言理解中预测的理解主要是基于对极端预测性句子和非预测性句子之间性能的比较。

有几项研究强调需要更认真地探索“何时问题”。在印地语形容词-量词-名词结构中,识字率低的成年人没有预料到目标(Mishra et al., 2012),生产词汇量低的两岁儿童没有预料到目标对象(Mani and Huettig, 2012),以及老年人作为一个群体没有预测性地使用上下文(Federmeier 等人,2012 年)。这些研究表明,语言理解者并不总是能预测。

被试群体:需要更多的被试群体不同的研究,以及跨语言研究来探究when这个问题。

研究方法:重要的是要考虑用于研究预测语言处理的方法。在过去的 20 年中,视觉情境眼动追踪实验和 ERP 研究已成为预测研究的首选方法。这两种范式都有重要的优势,但也有其自身的特殊局限性,在从实验结果中得出结论时必须考虑到这一点。视觉世界眼动追踪研究的一个明显限制是呈现的语音必须与视觉输入相关。此外,视觉情境眼动追踪研究中呈现的视觉信息可能会以微妙的方式影响语言处理。ERP 研究书面文字通常以相对缓慢的方式一个一个地呈现。语音刺激中非预期词可能与预期词在词头重叠。

6.结论 ¶

回顾的文献清楚地表明,已经探索了预测语言处理的许多方面。已经取得了一些实质性的进展(例如,我们对用于预测的线索了解很多),但也很明显我们的理解存在许多差距,这需要进一步的系统研究。我们对预测的内容知之甚少。预激活级联有多远以及它在多大程度上取决于情况?近年来取得的一项重要进展是,研究人员更直接地关注预测语言处理的潜在机制。作者建议包含 PACS(基于生产、关联、组合和模拟的预测)机制是对预测性语言处理进行全面说明的最低要求。这里考虑的实验证据还强调,未来的研究需要更多地考虑介导预期处理的个体差异。本文已经讨论了工作记忆、认知效率、年龄和识字率的作用,这些都会影响预测。还有许多其他个体差异可能会起作用。

最后一个重要的考虑是预测语言处理的局限性。我们的大脑真的是预测机器吗?我们是否真的在所有级别的语言(和非语言)结构中不断地进行预测(参见 Clark,2013;Friston,2010)?也许预测是在认知系统拥有大量可用资源时发生的事情。根据这个概念,预测与手头任务的高熟练程度密切相关。上文讨论的识字对预期语言处理的强烈影响清楚地指向了这个方向。也许在具有挑战性的情况下(参见 Brouwer 等人,2013 年)和不太熟练的语言用户,预测发生得很少或根本不发生。也许在这种情况下预测发生得更多(对于有挑战的语言用户来说更多)。预测是一个重要方面,但可能不是语言处理和人类思维的基本原理?