Mu波说明了语音加工时运动和运动前脑区的自动激活



文献:Oliveira, D. S., Saltuklaroglu, T., Thornton, D., Jenson, D., Harkrider, A. W., Rafferty, M. B., & Casenhiser, D. M. (2021). Mu rhythm dynamics suggest automatic activation of motor and premotor brain regions during speech processing. Journal of Neurolinguistics, 60, 101006. https://doi.org/10.1016/j.jneuroling.2021.101006

原文

1.背景和目的 ¶

对于听语⾳是否激活⾃动语⾳特定神经过程,或者此类活动是否由于注意⼒和记忆等⼀般认知机制,结果好坏参半。一种研究表明,观察到的活动反映了一般的认知机制(如注意力、预测、工作记忆),另一种研究表明,活动是特定于言语感知过程的。

本研究使⽤事件相关光谱扰动 (ERSP) 分析试验过程中的 mu波,有助于消除相互竞争的假设。

2.实验方法 ¶

24名英语母语的女性,平均年龄为25.3岁。

刺激是由/f/和/v/组成的音节对,和中元音/ʌ/,形成单音节/fʌ/和/vʌ/。

所有的刺激都是由一个受过语音训练的美国英语母语者产生并记录的。说话者以正常的语音速率和水平产生了每个单音节的30个样本,并保持相似的音调。

每个单音节的最佳样本,通过整体持续时间、语调曲线和元音质量的相似性来判断,每个单音节的最佳样本被选择用于分类辨别任务。最好的样本是由两个受过语言训练的听众这样判断的。使用PRAAT对刺激的强度和持续时间进行归一化。每个单音节的强度被操纵为大约72dB,每个单音节的持续时间被设置为恰好600ms。然后创建一对音节,并插入一个250ms的静音段作为一个刺激间隔(ISI)。每对单音节后也插入550ms的静音段,这样每次试验的总持续时间正好为2000ms。

图1

被试听三种不同条件下的音频:1.被动听白噪声(控制条件),2.被动听音节对,以及3.主动辨别音节对。

在控制条件下使用噪声,因为mu活动可能受到注意机制的影响,所以即使是被动听力任务所需的低水平注意力也会影响注意力。此外,先前对mu节律的研究表明,mu抑制可感知的生物(如可重复的)刺激,而不抑制非生物刺激。听噪音与被动听言语所需的注意力大致相同,但不应诱导与处理言语(或生物刺激)相关的活动。

音节刺激以四种可能的组合呈现,形成以下对比:/fʌ/-/vʌ/;/vʌ/-/fʌ/;/fʌ/-/fʌ/;/vʌ/-/vʌ/。条件分为两个block,包括40个试验,每个试验有20对匹配和20对不匹配来控制选择偏倚,总共240次试验。

刺激物使用神经扫描的Stim2呈现软件在PC计算机上呈现。被试总是首先面对被动倾听的条件,这样不会有分类倾向。在主动任务中,被试被要求通过按下一个按钮来积极区分音节对。研究表明,运动前计划发生在肌肉收缩前1秒的重复按下按钮的运动中和感觉运动抑制(ERD)高峰后不久(200ms)。为了控制反应准备可能混淆与刺激处理相关的运动活动的可能性,被试的手动反应被100ms,1000hz的锯齿波音提示,在刺激开始2000ms后出现。被动收听条件之后也按按钮,以控制在主动条件下所需的按钮。在被动听力条件下按按钮也可以确保被试注意所呈现的刺激。按钮按下顺序(右或左手)在被试和实验条件下是平衡的。在所有条件下按下按钮的存在确保了任何差异活动都不是与按钮按下运动相关的运动活动的结果,而是不同条件下需求的结果。

脑电图数据采集的总持续时间约为60min。使用扩展的国际电极通道的10-20电极放置方法获取脑电图数据。在记录过程中,电极参考FZ1前的中线电极,在预处理过程中,参考共同连接的左(M1)和右(M2)乳突。将电极分别放置在左上眼眶和左下眼眶(VEOG)以及左侧外侧和内侧导管(HEOG)上,监测眼球垂直和水平运动,记录眼电图(EOG)。

脑电图数据采用计算机医学神经扫描4.3.3软件和Synamps2系统采集。原始的脑电图数据被过滤(0.15-100Hz),以500Hz的采样率进行数字化。数据被时间锁定到声刺激的开始(时间=0),时间零点表示控制条件下白噪声的中点。

使用EEGLAB进行处理。每个被试的数据构成每个情况下的单一的80个试验数据集。然后将数据降采样到256Hz,以减少ICA处理的计算需求。然后将数据在时间0前后从−3000到+2000毫秒划入5000ms段。带通滤波3到34Hz,以确保在过滤来自周围频率的肌肉运动和线噪声的同时,肌肉运动和beta可以被识别出来。将数据重参考到乳突电极,并用肉眼检查大体伪影,并人工删除错误的反应或反应延迟,每个被试平均延迟的两次以上。数据分析中,只包括了正确区分的试验,以确保被试关注当前的刺激和任务

为了确保稳定的ICA,每个条件下的每个被试至少需要贡献40个分段。每种情况下被试的可用试验的平均数量超过了纳入的阈值;因此,没有被试因为这个标准而排除。

  • ICA

对个体数据进行预处理后,在ICA前,每个被试的预处理脑电图数据在不同条件下被连接起来,以获得一组ICA weight。**这允许在空间固定的独立成分内比较不同条件下的活动,即每个被试的所有条件都具有相同的成分权重集,这就允许在不同条件之间进行有效的比较。**然后使用一个扩展的Infomax算法(Leeetal.,1999)对数据矩阵进行去关联。

使用EEGLAB进行run ica,初始学习率设置为0.001,停止权重为10−7。分解后,每个被试获得66个ic,反映了记录电极的总数(68-2个参考电极)。通过将逆权重矩阵(W−1)投影回空间脑电图通道配置上,获得每个IC的缩放图。

在ICA分解后,使用DIPFIT工具箱中的standard 4-shell spherical model计算每个组件的等效电流偶极子(ECD)模型。将标准的10-20个电极坐标扭曲到头部模型,然后对球形线矩阵进行粗精细拟合,为每个1584个ic(66个ic*24个参与者)产生一个偶极子模型。偶极子定位需要将信号反向投影到可能产生给定IC头皮分布的源上,然后计算最佳正向模型来解释头皮地图方差的最高百分比。根据初始头皮图与ECD模型的正向投影之间的潜在不匹配,还计算了偶极子定位中的残差方差(RV)。

采用EEGLAB-STUDY模块进行组间数据分析。该模块允许使用不同条件下的多个参与者的ICA数据进行分析,使用与测试中的假设相关的指定设计。为了当前研究的目的,进行了一些对比来分析被动和主动条件之间可能的显著差异。只有定位于皮质体积内且残留方差(RV)<25%的成分被纳入组分析,因为较高的RV水平可能表明存在伪影。双侧mu组中所有被试的平均残差%为<15%。

STUDY分析完成后,使用K-means统计工具箱进行成分预聚类,即EEGLAB工具箱的一部分,该工具箱使用基于一般头皮地图、偶极子和光谱的信息,通过PCA对每个被试的相似成分进行分组。然后分别检查得到的神经簇的光谱、头皮图和偶极子,特别关注感兴趣的簇:左右mu簇和邻近的簇。双侧mu簇的纳入标准包括一个特征的alpha和频率范围的频谱,RV<25%,以及定位到公认的mu节律发生器位点(即BA1-BA4和BA6;即体感区、运动前区和初级运动区)

在识别和检查mu簇之后,使用ERSP分析来计算感兴趣的光谱范围(4-33Hz)内功率随时间的变化(以标准化dB单位缩放)(即时频分析)。时间频率变换是使用3Hz的莫雷正弦小波(Morlet sinusoidal wavelet)设置为3个周期,在33Hz时线性上升到20个周期。本研究采用900ms的前刺激期,从−2900到−2000ms的时间间隔中选择,作为每个试验的基线。该基线是由一个替代分布构建的,基于从1000ms试验间隔内随机选择的200个延迟窗口的光谱功率估计。使用引导重采样方法(p<0.025对错误发现率(FDR)进行校正)计算后续个体ERSP随基线随时间的变化。在时频分析中输入了单个频率在7~27Hz和−500~2000ms时间的所有实验条件下的单次试验电流。

3.结果 ¶

被试的平均歧视准确率为98.8%(范围:95+100%)。只有正确的试验⽤于EEG分析,以确保被试注意当前的刺激和任务。

在所有语音感知条件下,左右各部分成分均定位于感觉运动区域。这种反映言语感知过程中感觉-运动转换的双侧激活模式是意料之中的,已在其他研究发现。

19名参与者贡献了39个IC呈现了独特的左mu节律标记,22名参与者贡献了47名IC呈现了右mu节律的独特标记。平均源定位:左半球[(x、y、z)−40、−5、51];右半球[(x、y、z)41、−6、49]。左右mu簇的平均残差(RV)均小于9%(分别为8.42%和8.55%)。

图2

类似的结果模式在左半球和右半球都发现,左半球通常表现出稍强⼀些的⼒量。因此集中讨论左半球的ERSP。

与被动语音感知相比,mu-alpha和beta的ERD在主动语音感知中的能力显著提高(pFDR<0.05)。这种效应在刺激呈现期间,特别是在刺激呈现之后都很明显,最大的激活区域在音节偏移后约300ms开始。虽然在被动任务中弱alpha和beta的ERD可见,但在两个音节(~600-800ms)之间,它在主动任务中的存在明显更强。

图3

图4

进一步探讨被动语音感知任务与基线噪声条件下感觉运动激活的差异。被动语音感知任务在音节呈现期间和600-800ms)之间表现出(pFDR<0.05)更强的alpha和beta ERD(600-800ms),在刺激抵消后显著更强的alpha ERD(1450ms)。此外,与被动语音感知任务相比,噪声条件在alpha和beta波段总体上呈现出更大的功率(ERS)的增加,这与主动语音处理的抑制相一致。

4.结论 ¶

本文使用ERSP分析来暂时分解被动和主动语音感知任务中的脑电图mu节律中的振荡活动。独立成分分析(ICA)确定了定位于BA6(运动前皮层)的双侧mu节律,这与已知的mu节律发生器(Hari,2006;Nystrom,2008)和背侧流的前中心(Hickok&Poeppel,2004)相一致。在所有条件下,ERSP分析都显示了左右mu成分中相似的振荡活动模式。此外,在两个半球的振荡活动中检测到与条件相关的差异;这与双侧感觉运动对语音处理的贡献相一致(Coganetal.,2014)。所有条件都需要在试验结束时按下按钮,以帮助确保每次试验都得到足够的关注,即使在任务的认知需求较低时。此外,通过在所有条件下使用按钮,控制了由于运动预期的任何振荡活动。因此,观察到的条件之间的差异不能归因于按钮按下的响应。

研究结果表明,在听语音时,大脑的运动和运动前区域会自动激活。进一步认为,通过检查试验过程中ersp的动态,这种激活可以与更具挑战性的任务中观察到的任务相关或一般认知神经活动区分开来。这些发现与最近的ECOG研究一致,该研究表明,当参与者听句子时,运动通路的激活,这些激活后来被转化为短期记忆,使用运动前和感觉运动皮质作为表征之间的桥梁(Muschetal.,2020)。

5.未来研究方向 ¶

1.进一步阐明正常和临床人群中语音处理的性质是必要的。被动感知任务中,仍然不清楚记录的活动是否由于刺激是言语。因为本文不是将语音和非语音进行比较。

2.被动听言语和非言语刺激的时候,激活程度是否不同?

3.面向不同人群的研究,本研究的被试仅仅是成年女性。

4.针对临床群体,语音处理障碍是否和自动激活有关,揭示障碍的本质。