词汇声调和辅音早期听觉加工的相反半球优势模式



文献:Luo, H., Ni, J. T., Li, Z. H., Li, X. O., Zhang, D. R., Zeng, F. G., & Chen, L. (2006). Opposite patterns of hemisphere dominance for early auditory processing of lexical tones and consonants. Proceedings of the National Academy of Sciences103(51), 19558-19563. https://doi.org/10.1073/pnas.0607065104

论文原文

1. 研究背景

人类大脑半球处理信息的功能是专门化的,自19世纪以来人们一直认为左半球在言语感知中占主导地位,但大脑使用什么线索来决定这种分工仍是一个有争议的问题。功能假说认为线索是听觉输入的语言功能:携带语义信息的声音优先在左半球处理。而声学假说声称,线索是听觉输入的声学结构:频谱变化的声音优先在右半球处理,而时间变化的声音如无音调的语音则在左半球处理。这两个假说都不能解释所有的实验结果。

两种具有相同语言功能的听觉刺激,但一种是频谱变化的,另一种是时间变化的,可以用于两种假设的测试。有声调的汉语普通话中的声调和辅音是理想的刺激素材。汉语普通话不能只由辅音和元音定义,还包括声调。声调是元音的音高变化模式。例如,音节 /bai/四种声调分别代表不同的意思。除了一声,汉语声调的频率随着时间而缓慢变化,而辅音的频率随时间快速变化如图1AB所示。声调和辅音在定义语义方面具有同样的功能,但是具有不同的声学特征。功能学预测声调和辅音基于其同样的语言学功能都主要在大脑的左半球加工;而声学假说则基于他们声学特征的不同预测声调主要在大脑右半球加工辅音主要在左半球加工。

图1

当使用非言语声音作为刺激时,声学假说可以很好地预测功能磁共振成像(fMRI)或正电子发射断层扫描(PET)揭示的偏侧化模式。来自fMRI或PET实验的数据反对这一假设,这些实验用声调作为刺激来证明与说英语的人相比,声调母语者大脑左半球的额外区域会被激活,这表明大脑半球侧化是基于语言功能和语言经验,而不是声学特征。因为fMRI或PET以几秒到几十秒的时间分辨率测量血液动力学反应,并且这些神经成像研究需要受试者执行辨别任务,从这些研究中观察到的结果可能代表了暂时聚集的脑活动,包括在听觉处理的注意阶段的脑活动。然而,对语音的听觉反应的半球侧化可以早在刺激开始后144ms发生。因此,有一种可能性是,在早期阶段对声调的听觉反应实际上是根据其声学特征偏侧到右半球,但在后期处理阶段与反应成分混淆,但是在以前的fMRI或PET研究中没有明确显示。

因此本研究想通过被动听觉odd-ball范式用汉语母语者的失匹配负波(MMN)的全脑电记录来确定在早期听觉处理中,以上哪个假说占优势。记录的MMN反应发生大约在刺激开始后200ms,反映了大脑在前注意阶段的自动处理。

2. 研究方法

2.1 被试

22名汉语普通话母语者、听力正常的人(23-25岁,右利手,未受过音乐训练,13名男性和9名女性)参加了这项研究。

2.2 刺激

MMN是用声调对比和辅音对比引出的。声调对比通过在高频的标准听觉刺激(音节/bai/)中呈现低频的偏差刺激(音节/bai/的另一种声调)来引出的,他们之间的区别主要在于基频,但保持恒定的音频开始时间(图1A右)。辅音对比是通过在高频的听觉刺激(一声的初始辅音+元音/ai/)中呈现低频的偏差刺激(一声的另一个辅音+元音/ai/)来引出的,这两种刺激之间具有相对不变的基频(图1中),但有不同的语音开始时间(图1B右)。

2.3 步骤

通过使用被动听觉odd-ball 范式,用一组受试者(n =11)的声调对比和另一组受试者(n =11)的辅音对比来诱发MMN。要求被试在实验过程中忽略听觉刺激并观看一段无声的卡通视频。实验中标准刺激呈现频率为90%,偏差刺激呈现频率为10%。每两个相邻的偏差刺激之间至少有两个标准刺激。六个模块用于声调对比,三个模块用于辅音对比(如下图2所示)。每个组块包括 1080个trials。

图2

2.4 数据分析

从标准刺激中得到的电位减去从偏差刺激中得到的电位得到MMN,对从电极Fz记录的MMN峰前20 ms到该峰后20 ms(如图2 A和2B中灰色条所示)范围内的时间窗内的反应进行平均,计算这些区域中的MMN振幅(图2C)。用Curry软件(Neuroscan)对每个受试进行偶极分析,定位对声调对比和辅音对比的MMN反应的神经来源。

3. 结果

如图3显示了在头皮左右两侧的MMN反应。A上图表示左右两侧三对电极记录到的由声调差异引发的平均MMN,灰色的条表示计算MMN振幅的时间窗;A下图表示构建由声调差异引起的平均MMN的头皮地形图。B上图表示左右两侧三对电极记录到的由辅音差异引发的平均MMN,灰色的条表示计算MMN振幅的时间窗;B下图表示构建由辅音差异引起的平均MMN的头皮地形图。C表示从头皮左侧和右侧的三对电极记录的MMN平均振幅。由此可知MMN对声调差异的反应右侧比左侧更强;相反,MMN对辅音差异的反应表现为左侧比右侧更强。

图3

偶极子解也揭示了MMN对声调对比和辅音对比反应的大脑半球偏侧化的相反模式。如下图4所示,A图表示根据词汇声调差异(左)和辅音差异(右),用单个受试者的MMN记录的平均偶极子位置的轴向视图。对词汇声调差异和辅音差异作出反应的MMN的神经生成器位于双侧初级听觉皮质附近。B图代表从单个受试者的偶极子解获得的平均偶极子强度。在词汇声调(左)对比上,偶极子在右半球的强度明显强于左半球;在辅音(右)对比上,左半球的偶极子强度明显强于右半球。

图4

4.讨论

研究结果中呈现的对声调加工的右半球偏侧化不大可能是由于对声调加工更难,因为之前的fMRI或PET研究中,声调母语者对声调的听觉加工也会偏侧化到右半球。结果说明了在早期词汇加工中,大脑半球优势主要依赖于听觉线索。因此,就听觉感知而言,研究结果与两个半球的分工与声音的物理性质密切相关的声学假说一致。

本研究使用被动odd-ball范式下的MMN记录,时间分辨率为毫秒级,揭示声调和辅音的前注意听觉加工的半球不对称性最早发生在刺激开始后200 ms。然而这样早期诱发的脑活动不能被具有秒级时间分辨率的血流动力技术例如fMRI或PET明确显示。因此,在要求受试者执行辨别任务的先前fMRI或PET研究中观察到的声调对声调语言母语者左半球额下区神经回路的激活可能发生在前注意听觉处理的下游。并且,一些研究者已经推测可能存在低水平的听觉专门处理和高水平的功能专门处理,本研究也为这一观点提供了有力的支持。本研究进一步提出了一个二阶段的模型,在该模型中,语音最初在前注意阶段是作为一般的声学信号处理,而不是特定功能的信号,然后在注意阶段被表征为语义信息,激活左半球神经。这个模型认为大脑半球优势语音加工的第一阶段取决于声学特征,而第二阶段取决于在左半球整合语言信息的语言功能。根据这一模型,听觉假说和功能假说就不相互排斥,只是在听觉处理的不同时间阶段起作用。