语音的节律同步



文献:Meyer, L., Sun, Y., & Martin, A. E. (2020). “Entraining” to speech, generating language?. Language, Cognition and Neuroscience35(9), 1138-1148. https://doi.org/10.1080/23273798.2020.1827155

1. 研究背景 ¶

引用entrainment(节律同步化)这个术语时,需要进行一个清晰的定义:

  • 没有刺激节律的神经震荡活动 这是节律同步化的前提(Haegens, 2020; Obleser & Kayser, 2019)
  • 与外部有节奏的物理刺激的频率选择性相位对准
  • 节律性外界刺激在结束后大脑节律活动短暂性存在
  • 研究中的刺激特征是物理的,而不是表征性的
  • 节律刺激在生态学上是有效的

2. 节律同步还是追踪 ¶

Klimovich-Gray和Molinaro (2020)认为从自上而下的节律同步调制中分离内源性神经震荡活动会过度解析,即如果不与感知采样同步,语言单位的推理、生成和预测对理解几乎无用处。如Giraud(2020)所言,外源性和内源性振荡器不总是在神经解剖学不同;相反,一个单一的网络可能表现出节律同步,同时仍然作为一个起搏器。Giraud (2020)还提出,实现抽象目的的振荡器可能倾向于充当起搏器,而不太抽象的过程可能受节律同步的支配。按照这些思路,Giraud (2020)和Lewis (2020)都提出,节律同步和起搏之间的分离可能在概念上取决于抽象,在神经解剖学上需要增加网络大小。

提出内在同步是为了将起搏概念化,可以通过临床病理性人群来帮助区分节律同步活动和起搏活动,例如Broca区失语症患者就是潜在的完整的节律同步活动的案例,尽管他们存在异常的周期性chunk,但是这类人群能使外源性节律同步和内源性起搏活动分离开来。听觉区结构完整但左半球中央前损伤的Broca区失语症患者表现出改变听觉chunking的时间窗(Szelag et al., 1997),虽然不知道Broca区失语症中完整韵律同步的报告,但这类患者肯定能够遮蔽语音(Fridriksson et al., 2012; Fridriksson et al., 2015),在健康的被试中,韵律同步化与听觉有关,但与中枢前活动无关(Bourguignon et al., 2013)。并且重复经颅磁刺激健康受试者的左下额叶皮质可以影响语言chunking,同时保持韵律感知完整(Meyer et al., 2018)。原则上病理性数据可以将韵律同步化从生成语言chunk同步的内源性活动中分离出来(Ghitza, 2020)。精神分裂症(Kircher et al., 2018; Sterzer et al., 2018)的语言功能障碍被认为反映了言语感知和内部生成的语言预测之间的不平衡(Brown & Kuperberg,2015),在患有幻听的精神分裂症患者中,过于强烈的预测会引发语言幻觉(Alderson-Day et al., 2017),精神分裂症患者的听觉刺激与异常β-和δ-波段振荡相关(Lakatos et al., 2013),并且在只有嘴唇运动的刺激中观察到了听觉活动(Bourguignon et al., 2020; cited by Klimovich-Gray & Molinaro, 2020)。

3. 内源性震荡和节律同步化是如何相互作用的? ¶

Lewis(2020)抽象概念发生在对应于音位、音节、单词和句法结构的语音片段被遗忘之前。δ频段神经震荡到底是由韵律线索单独驱动的外源性节律同步的语言单位(Bourguignon et al., 2013; Gross et al., 2013; Mai et al., 2016)还是基于多次组块内源性产生的(Boucher et al., 2018; Ding et al., 2016; Meyer et al., 2016)或时间尺度上的预测(Arnal et al., 2015; Breska & Deouell, 2017; cited by Haegens, 2020; Donhauser & Baillet, 2019; Lakatos et al., 2008; Lakatos et al., 2013; Meyer & Gumbert, 2018; Stefanics et al., 2010; Weissbart et al., 2019),本文主张Ghitza’s (2020)的看法,即以上三种看法都正确,语音韵律可以外源性地诱导δ波段振荡,其周期则充当组块持续时间的内源性时间限制器,这也可以解释为什么在没有韵律提示的情况下也能产生多词组块,

4. 与单位的同步性:周期性事件相关电位 ¶

音位感知和多词组块存在内生的时间限制(Joliot et al., 1994; Schremm et al., 2015)。具有确定性时滞的语言加工可以锁相跨试验的内源性振荡,伪装成平均的诱发反应(e.g. Klimesch et al., 2007),发生在一个句子或叙述的每一个给定语言片段(例如,音节,词,短语)的语言加工将在分段频率上产生语音-大脑同步性,在极限情况下,振荡器系统和一系列诱发反应可能会相互接近。

在时域中,语言预测性与N400相联系,在频域中δ波段振荡与语言预测的计算度量相联系,N400的频率分解显示出主要为δ波段成分(Roehm et al., 2009),因此不清楚语言预测是否有一个诱发或振荡的基础。第二个例子,P600,被认为反映了当前句法结构或整体解释的修改(Bornkessel-Schlesewsky & Schlesewsky, 2008, 2019; Kaan & Swaab, 2003; Kuperberg et al., 2019),需要注意的是,P600可能由连续叙述中的每一个单词引发,这取决于所需的修改或重新解释的数量(Hale et al., 2018),虽然不知道P600的公开频率分解,但一系列单个单词的P600可能会在修订或整合需求和EEG之间出现振荡同步性。第三个例子是chunking,多词组块的边界伴随着CPS,CPS可以由韵律(Gilbert et al., 2015; Holzgrefe et al., 2013; Stein- hauer, 2003)以及阅读中视觉线索触发(Drury et al., 2016; Steinhauer, 2003),奇怪的是,在没有韵律线索的情况下PS也以2-3s的内生周期出现(Roll et al., 2012; Schremm et al., 2015),频域分析显示了在CPS窗口中的δ波段相位,以预测组块决策 (Meyer et al., 2016),CPS反映了致力于组块的内源性δ波段振荡的相位重置(Boucher et al., 2018; Ding et al., 2016)。

5. 总结 ¶

节律同步是描述听觉语音加工的一个重要术语,神经振荡也可能在语言单位的推理、生成和预测中起作用,但这不应该被称为节律同步,语言学家应该测试语音和文本语料库的周期性。