3声变调需要更费力的语音编码



1.参考文献 ¶

Zhang, C., Xia, Q., & Peng, G. (2015). Mandarin third tone sandhi requires more effortful phonological encoding in speech production: Evidence from an ERP study. Journal of Neurolinguistics, 33, 149-162. http://doi.org/10.1016/j.jneuroling.2014.07.002

2.研究背景 ¶

特定领域机制预测:词汇声调加工偏向于LH,因为声调在声调语言中起着区分语义的作用。但一般领域机制预测:词汇声调加工偏向于RH,因为会使用较长时间窗口中的频谱线索区分声调。这两种机制都有证据支撑,表明词汇声调感知可以激活两个半球。

但不清楚通过特定领域机制还是通用领域机制来介导变调的在线编码。一方面,由于变调可能被存储为特定的语言学知识,可能会通过特定领域机制进行介导。另一方面,由于声调产出类似于唱歌,因此变调的编码可能依赖于一般领域机制。

最近的fMRI研究发现,T3变调序列的产出激活右额下回后部(IFG)。由于左后IFG参与言语产出中的音节化。RH中IFG后部的激活可能暗示T3变调产出是通过通用领域机制介导的,类似于歌唱。但需要进行更多的研究才能更全面地了解T3变调产出的本质。

争论:变调编码是通过运算机制还是词汇机制进行的。计算机制:无论是真词还是新词,都应根据语音环境来计算声调的变调形式和非变调形式。词法机制:通过对词法表征及附加的语音形式的访问来对变调进行编码,因此只适用于真词。计算和词汇机制都可能是特定领域机制,但是计算机制具有较少的特定领域机制特征,因为它预测新词中也会出现变调,而且相对不受语义和句法约束。

以前的研究一致表明,T3变调会出现在新的双音节词中。为新双音节词中由计算机制介导T3变调编码提供了证据。但尚不清楚实词和新词是通过通用机制(计算机制)还是分别通过词法和计算机制来加工的。此外,什么时候进行词汇和计算机制的加工,以及神经活动是否有偏向?

研究目的:T3变调编码的本质是计算机制还是词法机制,其激活是偏向于左脑还是右脑,以进一步确定计算机制和词法机制的特定/一般领域性。

此项研究使用事件相关电位(ERP)来检查真词和新词中T3变调编码的时间过程。采用了被试内实验设计:词汇(真词vs.假词)×变调(T2+T3vs.T3+T3)。比较了T2+T3与T3+T3的隐性产出。此外,比较了真词和假词,以检查T3变调编码是否使用了类似的计算机制,还是分别依赖于词汇机制和计算机制。如果是计算机制进行介导,则无论是真词还是假词,都会影响P2的幅度(P2对语音加工和视觉单词编码非常敏感)。如果真词的编码是由词法机制介导的,那么只有真词能够访问存储的词法表征和语音形式,N400则表明访问词法表征和语义记忆。此外,比较了左,右电极的ERP,以确定激活的偏向。

3.研究方法 ¶

17名被试大学生,汉语母语者,右利手,听力正常,没有经过音乐训练,也没有神经疾病。

真词和假词条件各包括十个T2+T3和T3+T3词。10位没有参加ERP实验的汉语母语者,按照以1-9的等级(1非常不熟悉,9非常熟悉)来评估对每个词的主观熟悉度,通过主观熟悉度、句法结构匹配T2+T3和T3+T3刺激。对于假词,使用声母和韵母组合成不存在的音节(t和iang)。除测试词外,还包括填充词,填充词是双音节真词和假词,其中一半是T2+T1 / T2 / T4,另一半是T3+T1 / T2 / T4。测试词与填充词的比例为1:1。

要求录音者以完整的形式(即降升调)发T3。将所有音节的持续时间标准化为400 ms,平均强度标准化为70dB。此外,将第二个T3音节的F0轨迹变得相同以保持T3的相似识别点,以最大程度地减少在第二个T3识别-语音编码的试验间差异。

图1

使用了语音产出任务。试验开始出现十字并停留500毫秒,随后通过耳机呈现两个音节。为了使第一个音节的加工对第二个音节的影响最小化,两个音节的间隔为600-1000 ms。要求被试在听到第二个音节时,立即将这两个音节作为双音节词隐性产出,当屏幕上出现麦克风符号时口头产出双音节词。第二个音节结束到口头产出的间隔为1000-1600毫秒,从而避免了构音对第二个音节加工的影响。总共对T2+T3真词,T3+T3真词,T2+T3假词和T3+T3假词这四个条件分别进行了60次试验。在实验之前,让被试熟悉假词和实验过程。

4.数据分析 ¶

ERP时间窗口锁定在第二个T3音节的开始,比较了T3+T3(变调)和T2+T3的加工,以检验T3变调在真词和假词中的编码。一旦第二个音节被识别,两个音节将被串联起来并编码为隐性语音中的双音节序列。换句话说,T3变调编码取决于第二个T3音节的识别时间。 排除发音错误、两个音节间长时间停顿、不确定是否应用了T3变调的试验。针对每个被试,将每个条件的ERPs取平均值。

确定了五个ERP,分别为N1(140-230ms),P2(230-320ms),N2(320-520ms),N400(520-820 ms)和LPC(Late Positive Component,520-820ms)。N400和LPC发生在相似的时间窗口内,但激活区域不同。N400在额中央,而LPC在左半球后部。根据分布为N1,P2,N2,N400和LPC选择不同的电极组合。对于每个被试,分别将每个选定电极上的ERP进行平均。ERP的峰值延迟是根据在定义时间窗口内ERP的最小值(N1,N2和N400)或最大值(P2和LPC)确定的。N1,P2,N2,N400和LPC的平均幅度也可以从定义时间窗口中获得。

5.结果 ¶

词法(真词与假词)和变调(T2+T3与T3+T3)作为被试内因素,对每个ERP的峰值潜伏期和平均幅度进行ANOVA分析。

图2

在N1中,没有发现任何显著效应。

在P2中,变调对幅度有显着的主效应,T3+T3引起的P2比T2+T3大。此外,为了检查P2的偏向,从两个LH电极、中部电极和RH电极获得每种条件下P2的平均振幅。词汇(真词与假词),变调(T2+T3与T3+T3)和偏向(LH、中线与RH)作为被试内因素,对P2振幅进行ANOVA分析。偏向有显着主效应,但没有发现交互作用。事后分析表明,中线电极的P2大于LH和RH电极。 LH和RH电极没有显着差异。

在N2中,词汇对其峰值潜伏期有显着主效应,N2在真词中达到峰值的时间比假词早。

在N400中,词汇对幅度有显着主效应,假词引起的N400比真词大。

在LPC中,词汇对幅度有显着主效应,真词引起的LPC比假词大。 此外,由真词引起的LPC偏向LH电极,但没有观察到假词的偏向趋势。然后对LPC振幅进行ANOVA分析,被试内因素是词汇、变调和偏向,发现偏向有显着主效应,还发现了偏向和词汇的交互作用。事后分析表明,对于真词,LH和中线的LPC显着大于RH,而对于假词,LH,中线和RH的LPC没有显着差异。

6.讨论 ¶

T3+T3中的第二个3声音节引起的P2比T2+T3更大,由于更难的任务会引起更大的P2,表明T3变调的语音编码可能更费力。此外,在P2时间窗口中,真词和假词之间的语音加工可能不会在质上有所不同(缺乏变调和词汇的交互作用)。T3变调在真词和假词中的语音编码都可能由计算机制介导。它还提供了构音开始前对T3变调进行在线编码的证据,这表明T3变调不是构音的产物。

论文原文