论文原文 ¶

关键词 ¶

预测；合理度；句子理解

摘要 ¶

预测度和合理度的违反是如何影响语言加工的？当预测被合理和不合理的词否定时，它如何影响更长时的记忆和学习的？作者通过使用读者自己控制速度的句子阅读和名词识别任务来研究。关键句子会违反预测度或者合理性或者都违反，例如，‘Anne害怕蜘蛛，她不愿意去到‘，既预测又合理：地下室，预测外但有点合理：花园，预测外且完全不合理：月亮。句子阅读的结果发现了早期出现的关键词位置的预测违反效应，以及较晚出现的合理度违反效应。只有十分不合理的词才能增加识别记忆。早期出现的可预测性效应表明，无论语义如何，在处理流中很早就注册了未确认的单词形式预测。后来出现的合理性效应支持了一些模型，这些模型主张阅读理解的阶段性结构，其中合理性只影响后词汇整合阶段。作者的记忆研究结果显示，为了促进记忆和学习，需要一定程度的预测错误。

引言 ¶

先介绍了预测，不再赘述。作者想要研究预测违反和合理度违反时如何影响语言加工和更长时的记忆结构的，作者先定义，再回顾。

定义 ¶

预测度通常是完形填空概率的平均，合理度通常是让被试来对一个词填入某个句子有多合理或多有意义进行评分。

预测和合理度违反的效应 ¶

预测度和合理度是关联的，因此把他们对语言加工的贡献分离出来十分困难。预测度效应在ERP和眼动研究中记录很多，一般来说把预测度效应看作是对预测词的促进，与之相反的是对意外词的加工减慢。例如，Frisson发现，chair在一个强烈预测其他词的语境中出现，和在一个中性语境中出现，对于chair是意外词的情况，发现并没有额外的加工代价。而合理度就没有预测度那么清晰了。研究发现极度不合理的词会导致出现在相对较早（300ms）的加工困难。因此这个研究认为合理度违反对于自然阅读的影响是即时的，差不多和词频的影响一样早。但很难确定哪些是合理度的影响，哪些是预测度的影响。但是ERP研究显示出了和眼动完全相反的结果：合理度效应一定程度上比预测效应更晚，并且头皮分布也不一样。 Nieuwland发现名词预测度的增加会在较早的时间窗里降低N400幅度，而合理度的增加会在较晚和较长的时间窗里降低N400。在另一些研究里，意外且十分不合理的词会引起一个在后部电极的PNP成分，而意外但有点合理的词引起了一个不同分布的的正向成分，在前部电极。

预测和合理度违反在学习和记忆上的效应 ¶

更广泛的记忆文献经常使用“图式一致性”一词来指代在给定先前建立的世界或事件知识的典型或一致条件下处理的刺激，但是我们确实不知道这个图式一致性到底指的预测还是合理度效应或者两者都是仍不清楚，这可能是为啥研究都这么大冲突。 Rommers发现，当一个意外但合理词出现在一个中性句子中二次时，相较于最初在预测并合理的句子中出现而第二次在中性句子出现时，引起了更大的N400重复效应（减少的更多）。（’也就是说，预测词可能读者更加习以为常就没怎么注意/记住？‘）同时，意外且合理的名词显示出了较晚出现的正波，也就是recollection的过程。因此这些证据认为，不能预测但合理的的信息能够促进短期记忆，可能因为与预测不确定相关的更大的语义推敲。与基于预测错误学习和记忆的观点冲突的也有很多，例如，Holtje发现最初在图式一致的情况下编码的名词（例如，一只四条腿的动物————狗）在第二天的recollection任务中比出现在中性或不一致情况下的选中率更高，也就是更能记住？（但这个研究没有比较词频，只能做参考）。而还有研究发现最初在图式一致的情况下读到的词，其再认的准确率提升了，与那些最初在图式不一致的条件下出现的词相比。因此这些研究认为高预测度（或/和合理度）也许能促进再认记忆。还有些研究显示，当不一致词很少出现时，人们可能更能成功记住意外词因为他们很显著，然而当不一致项常常出现的时候，可能就没有记忆优势。还有架构认为没有预测且不合理的词能够促进记忆。

当前研究 ¶

本文的主要目的就是看预测度和合理度是如何影响即时语言理解以及长期记忆和学习的。作者采用了线上的研究，包括了逐词的读者自己控制速度的阅读，以及阅读完之后15分钟做的一个词汇再认的任务。材料包含了三种情况：例如，‘Anne害怕蜘蛛，她不愿意去到‘，既预测又合理：地下室，预测外但有点合理：花园，预测外且完全不合理：月亮。所有名词在词频和词长平衡。因此就有两组效应（地下室vs花园：预测度，花园vs月亮：合理度）在词汇再认任务里，作者把之前出现的词和一些新词都加进去了，然后还让被试表明他们再认判断的置信度。作者的第一个研究问题就是关于在阅读句子时，合理度和预测度违反的时间。合理性违规很早就影响了阅读，我们希望找到一种结果模式，即合理性违规影响了之前的阅读，或者在很大程度上与可预测性违规引起的影响同时发生，可能是对名词的影响。而如果合理度效应更慢，那么可能就会出现在名词后的一个词阅读减慢。第二个研究问题就是词汇再认任务的表现。如果确实是不合理的词驱动记忆，那么可能就会在同样不可预测，只有合理度区别的两个条件下存在差异。而如果是图式一致促进记忆，那么就会观察到一个相反的效应，对于预测且合理的词记忆最好。被试：80个材料和任务：45个句子，由三种条件呈现，每个句子都是有相对高的对某个词的限制度。如何创建的意外但合理的词以及意外且完全不合理的词？作者自己造的，没有出现在完形填空答案里的，大多数的极度合理违反的词都是和前面的动词完全不搭配。 2024-04-14-YXY-Fig1 但词频不太匹配，预测且合理的词词频比极度不合理的词词频更高，但并不影响。词汇再认任务包含了45个出现过的词和15个额外的出现过的词作为控制组因为他们没有受预测与否的影响。然后再来60个完全没出现过的词加入任务。对于句子都做了完形填空测试的。而对于合理度的测量，是被试1-7分制的合理度打分，对于预测内且合理的平均6.5分，对于没有预测但合理的平均3.9分，对于没有预测且不合理的平均1.41分。 那么对于预测和没有预测组的，它们的合理度都有显著的区别，这咋能比较呢？？？？作者认为可以，他会在讨论里讨论。 程序：20多分钟的自己控制速度的阅读，10分钟的记忆力间隔，15分钟的再认，就是让被试回答某个词在之前出现过没有，同时还要加上判断的置信度，因此就有四个可能的回答，也许新一定新，也许旧一定旧。

结果 ¶

混合效应模型做的。 1.阅读时间。作者有两个感兴趣区，一个是关键名词位置，另一个是关键名词之后的两个词（可能有溢出效应）。作者没有跑两个模型，只是把这个作为了一个交互作用变量。结果显示出了预测度的显著效应，也就是对于意外但合理的词更长的阅读时间，相对于预测词来说。但合理度的效应并不显著，但有区域和合理度的交互作用，表明了在关键词后面两个词的位置有更大的合理度的效应，相对于关键词位置来说。这个就表明了预测度比合理度更早地影响阅读。 然后为了比较这两个效应，进行了反应时间相减然后方差分析，发现合理度效应比预测度效应更大。 2.词汇再认。不管置信度的话，71%的出现过的词正确率，和26%的没出现的词却说出现了，说明被试认真。结果显示出了意外且不合理的词的再认准确率比预期外且合理的更高，同时显示了高置信度判断准确率比低置信度准确度更高。同时显示出了更长的阅读时间和更高的词频能够改善词汇再认。总的来说，在高、低置信度判断里，都有一种意外词比预测词更能准确识别的趋势。

讨论 ¶

总结：发现了较早出现且长时间持续的预测度效应，不仅在目标名词处有，在后面的词处也有（即预测的词阅读时间短，意外的长）。而不合理效应在目标词处没有，在目标词之后的两个词处有效应。因此预测效应是先于合理度效应的。但合理度效应比预测度的效应更大。而在词汇识别任务里，对于高-低置信度的判断，极端合理度都促进了词汇的记忆，而对于预期内和预期内都合理的词的对比来说，词汇再认任务没有显著的提升。 Brouwer and colleagues发现合理度的违反最先影响P600成分，而预测度的影响体现在N400。但也有一些显示是合理度的效应是先于预测度效应的，并且大多都是脑电的实验。其次是为什么这两个效应的时间点不同，一种可能就是这两个相互关联的变量可能在认知背景上是分离的。例如，一些学者就认为这两者对应着两种不同的策略，预测和整合。那么结果可能就表示预测先起作用，更重要的是表明了预测和整合实际上是分离的。这就和之前一些传统语言学认为两者是无法区分的说法不一致。但对于预测的效应并不存在，这就说明了可能单单是意外可能不足以驱动记忆。*这里我存疑，想设计一个实验，例如一根和一条都没有出现，但是出现过一个香蕉，那么一根会不会再认率更高？*作者认为只有特别违反预期的才会触发这种再认。然后，对于高低预测对比，它们的合理度也不同，作者认为在这种高限制语境里，确实可能只有预测词是高合理度的评分，暂时解决不了。