汉语语义特征预测:来自ERP的证据



论文信息 ¶

Kwon, N., Sturt, P., & Liu, P. (2017). Predicting semantic features in Chinese: Evidence from ERPs. Cognition, 166, 433–446.https://doi.org/10.1016/j.cognition.2017.06.010

论文原文 ¶

关键词 ¶

预测;量词;汉语;ERPs;N400;句子加工

摘要 ¶

本文报道了两项利用汉语量词系统进行语义预测的ERP研究。在普通话中,在特定上下文中,名词之前必须有量词,量词必须在语义定义的特征上与名词匹配。在这两个实验中,相对于匹配的量词,当量词与即将出现的可预测名词不匹配时,会产生N400效应。在不匹配的量词中,N400效应是分级的,相对于语义上与预测词无关的量词,与预测词语义相关的量词的N400效应较小。由于量词出现在预测词之前,这个结果表明,在自下而上的输入之前,可以预先激活名词的细粒度语义特征。因此,这些研究扩展了之前的发现,之前的发现基于的是更有限的高度语法化的特征,如印欧语中的性或animacy (Szewczyk & Schriefers, 2013; Van Berkum, Brown, Zwitserlood, Kooijman, & Hagoort, 2005; Wicha, Bates, Moreno, & Kutas, 2003)

引言 ¶

尽管已经有一些令人信服的证据支持语义预测,但大多数相关研究都是基于性别或animacy等单方面的语义差异,并在印欧语言中进行的,其中性和/或animacy等语义特征是高度语法化的,并与明显的形态句法标记相关。为了评估语义预测的通用性,本研究使用了汉语量词系统,其中量词和名词之间的一致性是基于感知到的相似性,这种相似性是从功能上或感知上定义的,代表了各种语义关系。 先前的研究基于行为学上的反应时或眼动的注视比例,或ERP来证明了词汇预测。在ERP中,有的研究者发现N400的幅度在给定的上下文中取决于项目的可预测性而变化(Chow et al. 2014),同时,当词汇单独呈现时,高频词引起的N400小于低频词(Rugg, 1990)等。同时,在一项研究中,研究者比较了两种类型的语义类别违规的ERP反应:一种是与预测项来自同一语义类别的意外物品(withincategory),另一种是来自不同语义类别的意外物品(between-category)。这两种意外的物品都会比预期物品引起更大的N400,然而,尽管完形填空的概率同样较低,但类别间冲突引起的N400比类别内冲突引起的更大。结果表明,词的神经表征是基于一组语义特征的,语义特征的重叠有助于在线语言加工中对意外物品的加工,这与本文的研究相关。同时,有的研究表明,理解者预测特定的单词或者特定的音韵形式(如冠词a/an带来的N400区别);有的研究表明,理解者预测特定性的名词(如西班牙语中,阴/阳性冠词带来的N400区别) 而有的研究发现,性别与预测名词不匹配的形容词引发了更大的额中央的positivity,Thornhill and Van Petten (2012)认为N400与概念期望有关,而额中央正性与具体的词汇期望有关(因为同为预期外的词,语义相关的词引起的N400比语义不相关的词引起的N400小,相反,这两者间激发的额中央正性并没有因语义是否相关而不同。) 总而言之,以前的研究表明,语言处理可以是预测性的,至少在某些情况下是这样。 为什么进行本实验?

  1. 尽管语义预测的证据令人信服,但所有的相关研究都是用印欧语进行的
  2. 当在预测单词之前的单词位置检查预测效果时,预测效果总是基于一维语义特征,如性别或animacy,这些特征高度语法化,并与所检查语言中明显的形态句法标记相关

接下来作者对汉语中的量词的语义特征进行了简单介绍,比较重要的:1. 量词修饰的一组名词之间的相似性可能相当抽象,甚至看起来是任意的。2. 名词和量词之间是多对多的关系。 同时简单介绍了一些对量词的N400研究。

实验1 ¶

  1. 实验材料 主要通过让汉语母语者完型填空确定目标量词和名词是否符合预期,从而确定了102个句子,每个句子包含expect、related、unrelated三种情况的量词名词短语。同时确定三种情况下,量词、名词的平均频率、复杂度等没有显著区别。将102×3个句子分为三组,每组再加113个filler,每组内再分为4个次组(filler没具体说是啥条件,难道不会产生rational adaption吗)。
  2. 参与者和实验过程 被试挺少的,仅21个母语者,该实验逐词呈现,每个呈现400ms,间隔400ms,同时最后还有一个理解问题(?)

该文中数据分析基本选用ANOVA,其中涉及主效应和交互效应分析,主要是句子类型×电极位置的交互效应,可见一篇参考文(https://zhuanlan.zhihu.com/p/448992914) ,spss里用的话句子类型×电极位置的交互效应的F和p会直接报告? 3. 结果 量词位置的ERP:单因素方差分析显示句子类型的主效应(p<0.05),事后比较句子类型间的差异:unrelated条件比expected条件下N400更负(无论是侧向还是中线水平),相似的,related条件下比expected条件下更负(侧向p<0.05而中线水平n.s.),而unrelated条件下比related条件下更负(中线和右半球水平p<0.05,而左半球n.s.) 名词位置的ERP:视觉检查表明,无关和相关的情况在中央-后部区域引起的负性比预期的情况更大。这一观察结果得到了统计上的证实。unrelated条件比expected条件N400更负,以及额叶上的正性更强(实际上这个分析过程相当复杂,不仅比较了中线水平和侧向水平,还比较了额叶水平和中央后部水平的额叶正性以及N400,有的只在某个水平上显著,但文中也报道出来了,对于不同水平代表什么,还需要再理解理解);related条件比expected条件具有更大的负性,但额叶正性不显著(同样在不同的区域有不同的结果,见原文);unrelated条件比related条件下更负。

2023-06-24-YXY-Fig1

但由于被试太少,仅有14个,结果可能不准确,需要在有更多参与者的条件下复制结果,因此进行实验2

实验2 ¶

实验2与实验1完全一致,仅仅是被试人数更多(30人,也没有多很多?不过女性占比更高了,17/30) 结果:根据目测来看,中部后方的结果与实验1一致,即unrelated和related负性均大于expected,并且unrelated大于related。同时ANOVA分析结果与实验1大致类似,可见原文,总体情况见上图。 比较重要的不同是:与实验1不同,无论是unrelated条件还是related条件下,额叶正性都不明显,而实验1中,unrelated条件下有明显的额叶正性。

讨论 ¶

两个研究都证实了:如果预测的中心名词的语义特征被预激活,则unrelated和related条件下的量词会由于语义不匹配而引发N400。 同时,研究者预测unrelated条件会比related条件下的加工难度更大,这一预测也得到了证实,在名词位置,unrelated名词比related名词引发了更大的N400,并且这种效应在名词之前的位置(即量词的位置)就已经出现了。 这些结果符合这样的假设:即将到来的词的语义特征在实际单词自下而上输入之前被预激活,并且这些特征促进了那些与预测单词有许多共同语义特征的意外项的处理(related条件),而非那些与预测单词共同特点较少的词(unrelated条件)。 因此这些结果可以作为证据来证实预测加工的普遍性:至少,在高度受限的语境信息下,即使在没有与显著语义特征(如animacy、性别标记)相关的显性形态句法标记的语言中,语言加工也是可预测的,并且预测是足够细粒度的以包括汉语量词所基于的广泛语义分类的信息。

作者提出了一种可能,对我的想法很有帮助:由于汉语中的量词具有语义内容,在量词位置观察到的N400可能反映了语义整合而非预测,在这种假设下,N400可能是量词与前一个关系从句难以整合的结果,但本研究施事和动词的组合将导致对特定词的预测(如张艺谋导演的…),鉴于所用的句子的性质,量词的处理不太可能独立于特定的名词。(那么为什么不可以是两者同时存在呢?可以从这个角度引出“…汽车一辆”研究),总之作者认为,在解释量词时,不太可能不考虑我们材料中预测的中心名词。 作者认为在related条件下,语义重叠越多,可以相对缓解句子意外延续的加工难度,因此,在量词位置观察到的N400可以更好地解释预测名词的语义特征的预激活。

以上是针对N400的讨论,接下来是针对额叶正性的讨论: 该文中额叶正性的结果比较出乎意料:实验1中仅unrelated条件下轻微显著,related条件下不显著,而实验2中两种条件下均不显著,这与预期不符合。 额叶的这个正电压取决于可预测性和合理性(plausibility),尽管没有操作句子的合理性,但我们普遍认为related条件比unrelated更合理,虽然两者都是预期外的,因此研究者认为预期结果是related条件下显著,unrelated条件不显著,但当前研究结果并非这样,与以往的研究结果不一致。但与N400相比,与预测相关的额叶正性较少被引发、相对脆弱,因此实验1中观察到的额叶正性与词汇预测的关系可能也不大,需要今后再研究。