对于语言理解来说预测是不可或缺的吗?



论文信息 ¶

Huettig, F., & Mani, N. (2015). Is prediction necessary to understand language? Probably not. Language, Cognition and Neuroscience, 31(1), 19-31. doi:10.1080/23273798.2015.1072223

论文原文 ¶

关键词 ¶

认知;语言加工;学习;预测;预测加工

摘要 ¶

最近,认知科学的一些理论研究认为,预测对于理解语言是必要的。本文中,作者评估这个说法。作者还思考了,”预测提供了人类思维的统一理论原则,而且它渗透到了大脑皮层功能“这种观点。作者讨论了人类发现统计规律的能力的证据是否一定是预测加工的证据,并且评估了”预测对于语言学习是必要的“说法。作者指出,并不是所有的语言使用者都能够预测语言,而次优的输入往往使得预测变得非常有挑战性。此外,预测强烈依赖于上下文,并受到资源限制的阻碍。作者还认为,预测性的语言街工的大多数实验证据来自于”鼓励预测“的实验设置,这可能是有问题的。作者认为,在没有预测的情况下,也能够学习和理解语言。声称所有的语言处理都是预测性的还为时过早。

引言 ¶

最近关于语言理解中的预测研究很多,许多研究者似乎都支持“预测对于语言理解来说是必不可少的”这种观点(这种观点与最近提出的预测是人类信息处理的一项/基本原则的观点一致)。作者在文章中讨论预测在语言处理中的作用是否被夸大了。不同于一些传统的观点(比如说一些语言学家认为预测没起作用或者作用很小,因为单词选择范围太大了),作者赞成中间观点,作者认为在许多情况下,预测有助于理解,因为它为处理特定情况提供了帮助。然而,作者猜测,语言理解并不总涉及预测,因此对于语言处理来说并不是必须的。作者的结论是关于语言理解中的预测的结论,并不一定与物体识别/感知/行为研究中的预测有关。作者的论点更普遍地与认知研究相关,只要有人声称预测对于认知是必要的。如果预测是人类思维的宏大统一原则,那它一定也是语言处理的统一原则。作者首先批判性地讨论了为什么预测可能对语言理解必不可少的潜在论点,随后提出了一个观点:即预测提供了帮助,但对语言处理来说并不是必须的,最后作者讨论了未来在这一问题上研究的潜在途径。

1. ”预测对语言处理是必要的“观点的潜在证据 ¶

  1. 预测为认知科学提供了统一的理论框架 一些理论家认为”大脑就是一个预测机器“,认为预测”提供了对神经表征、神经计算和表征关系本身的独特描述“并”对感知、认知和行为进行了深度统一的描述“。然而,我们是否真的需要一个人类大脑所有功能背后的统一原则?也许奥克姆剃刀原则可能支持这种统一原则,但作者和其他一些学者不同意,一些学者认为,大脑功能不可能有宏大的原则,因为像大脑这种复杂器官几乎肯定会使用一套不同的原则。sloman(2013)指出,人们,尤其是儿童,往往专注于扩展能力,通过探索而不是预测来参与学习。而注意力文献中也有一些经典的效应,预测框架要么做出错误的预测,要么没有提供任何解释。总之,这种关于预测的深度统一的框架还有待于彻底的检验,而且目前还不够具体,不足以成为令人信服的论据。
  2. 预测贯穿大脑皮层功能 预测是否有贯穿大脑皮层功能的神经基础?许多相关学科人员都会说”是的“。一些人认为‘大脑从根本上参与了预测编码和计算预测错误,这些错误被认为会使我们的大脑偏向做出正确的推理”。根据Friston的说法,预测编码涉及通过大脑皮层层级之间的反复或相互作用来最小化预测误差。较高的层级被认为是创建较低层次(皮质或者皮质下)活动的forward modal。而较低级别的活动被认为仅包含较低级别的预测活动和实际活动之间的预测误差,预测误差被用来更新低水平大脑皮层活动的forward modal。 然而,我们的大脑在语言处理过程中参与预测编码的实验证据非常稀少,可能是因为可用的方法的局限性。一个有趣的建议是,语言处理过程中的震荡活动提供了一种预测编码的方法。α和β振荡被认为是自上而下处理的索引,而γ震荡被认为是自下而上处理的索引。更具体地说,Friston似乎认为α和β地震荡活动,反映了较低水平(皮质/皮质下)活动的forward modal(即预测),而γ振荡活动则反应了对预测误差的处理以更新预测。 有什么证据可以证明这些假设是正确的呢?预测可能涉及句法统一操作。确实有一些研究发现,在句法正确的句子里,比在包含句法违规的句子里,β频率范围内的power更高。这与β震荡表明句法统一的概念是一致的,提供了β震荡和句法预测之间的潜在联系。还观察到,与语义正确的句子相比,违反语义的句子导致β频率范围内的power较低,这也与beta震荡与预测有关这种说法一致。然而,也有些研究观察到了相反相反的震荡活动。例如一些人发现违反世界知识的γpower更高,而语义正确的γ震荡power没有增加。 作者承认有人试图在预测编码的框架内解释这些不同的发现集合,此外作者不能排除未来的研究会提供震荡活动与预测相关的证据。但就目前而言,实验证据并没有为这个说法提供特别有力的支持,即预测至少就语言加工而言,是贯穿大脑皮质功能的。
  3. 人类善于检测语言输入中的顺序统计规律 即使是年轻的语言学习者也能够熟练地检测输入中的统计关系。核心证据来自于对英语学习输入中的统计相关性的研究(就是那个pabitobibabupatido这种三音节连着出现的研究)。结果可以解释为:1. 婴儿听到一个音节时对另一个音节预测,基于这些音节在之前的经验里的高频率的共同出现。2. 独立于任何基于预测的加工,婴儿能更简单地识别频繁出现的共现音节。眼动实验也提供了读者使用过渡概率形式的统计知识(即两个词共同出现的可能性)的证据。也有的实验显示出了词频的影响,在高度预期的语境中阅读低频单词应该会更容易,而在高度预期语境中阅读高频单词应该会带来更少的好处,因为高频单词无论在什么语境下都很可能发生,但大量的研究没有发现如此显著的频率和可预测性之间的相互作用,也没有报告任何一致的趋势。 然而,也有统计规律的提取和语言预测之间存在联系的一些证据:研究表明在统计学习任务中的表现与感知削弱了的口语时对单词可预测性的敏感度呈正相关。这种证据表明,善于检测内隐学习任务中统计关系的个体也擅长语言输入,但还是没有直接的证据明确地把统计规则的检测和预测性语言处理机制联系起来。有证据表明,随机输入可以形成比规则输入更好的项目表征。例如,四声鸟叫,要么随机呈现给被试,要么跟在强限制后面呈现给被试,被试的任务是报告他们在输入中听到的独特鸟叫的数量,被试在听到随机序列时比听到规则序列时的表现要好得多。这个研究提出了关于表征细节、统计规则的提取和预测之间联系的本质的问题。换言之,如果预测是被涉及的表征的稳健性增强,并且如果从统计规则输入学习中形成的表征不那么文件,那么在语言处理中的顺序规则的提取和预测之间可能没有那么强的联系。
  4. 没有预测,就没有学习 预测可能在语言学习中发挥重要的作用,并不一定意味着语言学习总是涉及预测。然而,一些人声称没有预测,就不可能学习语言。一些人声称“abstraction的发生是因为预测发生”,一些人认为“语言加工中的预测是语言学习的副产品”,这些人提出,语言习得机制依赖于一种基于错误的学习机制,这种基于错误的学习就是预测。Chang(2006)提出双路径模型,将预测的单词和实际出现的单词进行比较,任何预测误差都将用于调整模型的表示,换句话说,当模型预测句子中每个位置的下一个单词时,学习就发生了。Chang认为,成年人之所以会出现结构性启动(是什么??),是因为这种基于错误的学习机制在成人中仍然存在,根据这个观点,语言处理中的预测是语言学习的结果。 但又有研究显示,婴儿和成年人在流利的语言中追踪后面的统计数据,后面的过渡概率通常比前面的统计数据更有信息量。这里就用的是性别语言里的冠词来举例,名词通常与冠词配对,但冠词本身对名词的预测非常差,而通过名词我们可以知道前面应该用什么冠词。而这种后向的过渡概率不能用于预测,所以说,也许语言学习都需要预测这一观点是错误的。即使预测对于语言学习是绝对必要的,但也并不意味着预测对语言理解是必要的。 Mani&Huettig(2012)发现,两岁儿童的预测技能与他们的产出性词汇量显著相关,进一步的分析表明,儿童的预测能力与他们的产出技能有关,而非他们的理解能力。到目前为止,还没有进行研究直接测试儿童是否可以在没有预测的情况下学习新的单词/语法,未来的研究可以针对这一主题。
  5. 大量研究证据表明人们在语言处理中会预测 许多研究都表明了语言使用者在很多情况下都会预测。然而,这些关于预测的证据大多数与回答预测对语言理解的确切重要性的问题无关。大多数关于预测性语言加工的言语都是用了目标词非常可预测的句子,即极高完型填空概率的句子。需要对低完型填空概率项进行进一步的研究,以回答预测是否是理解语言所必须的这一问题。
  6. 总结 作者评估了5个潜在的论点,这些论点经常被用来声称预测对于语言处理是必要的。1. 作者认为预测提供了人类大脑运作的深度统一原则的理论框架目前说明太少,无法提供理论支持。2. 作者认为,目前可用的实验证据并不能从语言加工领域提供有力的支持,支持预测渗透到皮层功能的说法。3. 个人能从语音中提取出forward序列规则,几乎不能告诉我们这些结果在多大程度上是由预测驱动的。4. 几乎没有证据支持预测对于语言学习是绝对必要的这一说法,事实上证据表明,语言学习(至少部分)是在没有预测性学习的情况下进行的。5. 虽然证据很多,但是没有说明预测是理解语言所必须的。作者推测,语言理解并不是总是涉及预测,因此也不是语言处理所必须的,语言是可以在没有预测的情况下学习和理解的,下面就将介绍支持这一概念的论点。

2. 支持预测提供了帮助但不是必不可少的证据 ¶

  1. 并不是所有人都预测 一些研究发现,在儿童或者二语使用者中,有相当大的变异性,从没有预测的影响到微弱的预测。例如,儿童对即将到来的语言输入的预期受到儿童词汇知识的强烈影响,而驱动因素到底是儿童的理解性词汇量还是产出性词汇量,不同的研究之间存在差异。当然,预测量的变化并不一定意味着没有预测。然而,Borovsky(2012)发现,在完型填空得分低和词汇得分低的儿童中,即使是在强预测性的背景下,也不会注视相关的目标图像,而Mani(2012)发现,产出性词汇得分低的儿童不会在强预测性的背景下注视相关的目标形象。 同样,年龄较大的儿童,甚至成年双语者,文盲等研究都表明,并不是所有的听者都预测即将到来的语言输入,而且这个对即将到来的输入的预期受到了其他因素的强烈影响,例如听者的识字技能。例如,一些研究表明二语学习者在二语加工过程中没有表现出预测效应(也是通过prenominal效应来看的)。二语者的N400并没有在不一致的冠词处增加,这表明相对母语者,二语者使用语境线索来预测即将到来的语言输入更加困难。同时,还有研究显示识字率对眼动的影响,高识字率的被试能够根据偏向性的语境来关注目标对象,而低识字率的人更迟。也就是说,识字率低的被试能够使用口语来引导眼动,但是他们没有使用这些信息进行预测。 上面的这些二语者或者识字率低的人,都能够理解语言,但他们没有做出预测。Mani发现尽管被试儿童的阅读能力和他们的预测技能相关,但他们的语言能力和阅读技能之间没有相关性。总之,似乎很多被试减少或者甚至没有预期,但他们仍然是有能力的语言使用者。这表明,虽然预测可能对语言理解很重要,但是语言理解并不总是涉及预测。然而,这些发现也可能表明了,上述研究中的部分减少/不预测的被试相对于那些表现出更多预测性语言加工的组别来说,他们的预测速度更慢,也许给这些被试足够的时间作出反应,他们在语言处理方面也会表现出相似的预测效果。 可就算这些被试只是预测比较迟钝,这样的结论也会反对预测在语言处理中的必要作用,因为他们的语言处理似乎跟上了刺激呈现的速度,而预测却落后了。同时,研究发现这些低预测组在完型填空任务中也存在困难,这可能表明这些被试在缩小潜在词的选择范围方面存在困难。这些被试的词汇量也较小,可能表明总体上语言能力受损,这又反过来表明,语言能力受损的原因之一就是缺乏根本上重要的预测支持系统,然而,词汇量的减少并不意味着这些被试在识别他们所认识的单词方面存在困难,因此,单词识别可以而且确实独立于基于预测的机制进行。
  2. 次优的输入使预测的可能性降低(而不是更大) 预测的好处有很多,特别是在处理噪音或歧义的输入方面。因为一些学者认为预测是一种强大的工具,尤其是需要补偿噪声输入时,因为这种情况下,预测对解释有着自上而下的影响,他们认为这种基于产出的预测机制的影响与投入的质量成反比,因为研究表明,在噪音中解释不可信的句子时,自上而下的语义影响会增加。 然而,最近的一些研究表明,噪音和减少的语音输入不会造成任何差异,或者预测的可能性更小。观察到强烈预测性的语境只会在发音规范的句子中导致对目标词的预测,而不会在含有音位简化的句子中预测目标。这也许就说明了如果作为预测基础的输入很差,预测可能会非常具有挑战性。
  3. 预测强烈依赖于上下文 越来越多的研究发现了语言预测中存在着相当大的语境依赖性。Huettig(2015)观察到,当被试事先没有足够的时间查看潜在的主题合适的目标时,预测效果可能会完全消失(这里用的是性别冠词和眼动来做的),两个实验,一个提前呈现4s图片,一个只呈现1s,后者的被试预测就出现了点问题(慢语速能预测,正常语速就不行)。这个结果表明,语言使用者是否预测取决于理解者所处的环境,在两个条件下,语速较慢的条件都能预测,而当语速正常时,只呈现1s的条件没有预测,因此作者认为预测肯定是语言处理的一个重要方面,但不是一个必要的特征。 但有人提出,这种在某些情况下缺乏预测的证据可能只是反应了这样一个事实:由于经验较少,一些人对于他们的预测缺乏信心。理由可能是:预测总是在发生,并且在给定先前的背景或经验的境况下,预测系统的输出导致了更强/更弱的预测,然而预测性加工需要达到一定的阈值水平,才能启动行为上可观察到的活动,在语言使用者没有/不能依靠经验的情况下,预测可能是不可靠的,因此预测系统可能不会启动任何作用。这个说法可以解释很多实验的结果,比如在老年人中预测缺乏信心,如果在许多环境和人群中都很难观察到预测,那么预测到底对语言处理来说有多基础?
  4. 预测经常受到资源限制的阻碍 Christian提出,语音输入的处理受到严重的限制,导致了Now or Never的瓶颈,他认为,只有递增的、可预测的语言系统,能够应对语言输入的冲击。但作者认为,他忽视了这样的瓶颈也会对语言处理中的预测施加重要的约束和限制。记忆限制和输入速度通常意味着没有足够的时间或者资源进行预测。证据表明,对于特定的语言使用者群体来说,预测性处理可能是低效率的,研究发现老年读者比年轻人更频繁地跳过单词,可能是基于他们对下一个单词的猜测。这个发现可以解读为:老年人比年轻人预测更多的东西来弥补与年龄相关的认知能力下降。而另一方面,又发现与年轻人相比,老年人表现出较小的语境限制效应,归因于老年人对预测性加工的依赖减少。不少学者都认为,预测处理对老年人来说已经变得过于昂贵或者效率低下。 同样Huettig也表明,语言加工中的预测效果受到工作记忆和加工速度的个体差异的调节,因此工作记忆和加工速度较差的个体会显示出更弱的预测效果。需要进一步评估语言处理中的预测在多大程度上受到资源限制的阻碍。
  5. 许多预测的证据来自鼓励预测的实验设置 作者也觉得语言加工中可能会用到预测,许多研究都显示出了这种结果,但作者质疑这种预测性的语言处理证据在多大程度上表明了基于预测的语言习得和处理机制的必要性。基于目前的这种实验设置(眼动的话就是放一个目标图片和几个干扰图片),如果当这些图片没有显示在他们面前时,被试是否以类似的程度预测到了合适的目标呢? 一些眼动研究表明,即使在视觉显示中不存在合适的目标,被试也能预测即将到来的语言输入。例如,当听到“阿姆斯特朗是第一个登上..的人”,在“月球”出现之前,并且屏幕上没有月球图片时,会注视和目标形状重叠的图片,例如圆形。然而,作者认为,虽然预测可能不受提供的视觉语境的影响,但还是值得检查文献中报告的预测效果的强度在多大程度上可以归因于目标的可视呈现。 另一方面,日常生活中,语言加工中的预测往往类似于在几个预先激活的参照物里选择,这是肯定的,然而为了论证预测是语言处理的一个特征,必须区分纯粹基于语言的预测效应和语言介导的预期眼动(可能是由孤立的目标图像的呈现引起的)。 第二个问题涉及范式中通常呈现给被试的刺激的类型。通常,所使用的听觉刺激都是以慢速呈现的完美发音的句子,以便让被试有足够的时间启动预测性眼动。但记忆容量和认知效率即使在这种理想条件下也会影响预测效果,那么在自然对话中,这种影响程度也许会更甚,自然对话中提供的听觉和视觉输入的质量与实验室任务相比存在差异。 而且,不仅仅在于眼动实验,脑电实验里的实验材料以一种远离正常阅读情况的方式逐字呈现书面句子,通常很慢。由于绝大多数ERP研究仅在目标词期间测量预期的电生理信号,不能排除许多研究测量的是词的整合困难而不是预测。
  6. 总结 作者上述提出了5个认为预测对语言处理不是必要的论点。特别是,作者提出的证据表明,并不是所有的人都能预测,比如儿童、二语者以及文盲等。此外,作者还认为,预测的效果可能高度依赖于获得预测效果的语境。一方面,在没有以较慢的语音或者足够的时间来查看可能的替代方案的形式,预测效果可能会消失。另一方面,大多数范式都是用的这种高度限制的语境,这种和自然语言有较大的差距。作者还讨论了,在有噪音或工作记忆需求增加的情况下,预测实际上可能会减少。因为作者认为,虽然语言使用者经常预测即将到来的输入,但不认为预测是语言使用的必要特征。

未来研究 ¶

作者认为,未来应该更多地关注于理解为什么在一些研究里没有发现预测效果,而不是研究发现大量可靠地预测效果。例如,为什么某些人群里没有发现预测效果,这些人群在多大程度上受到语言技能或者一般认知技能的影响?或者,如果预测是某些任务、某些类型的刺激或工作记忆需求支持的,那么在自然对话中有多大程度是预测提供的?作者相信关注真实世界中的语言对语言加工中的预测更重要,自然语言往往是随意的,这些往往具有较低的完型填空概率。