内部言语伴随着时间精确和内容特定的必然放电



文献:Jack, B. N., Le Pelley, M. E., Han, N., Harris, A. W. F., Spencer, K. M., & Whitford, T. J. (2019). Inner speech is accompanied by a temporally-precise and content-specific corollary discharge. NeuroImage198, 170–180. https://doi.org/10.1016/j.neuroimage.2019.04.038

论文原文

内心话语——在一个人的脑海中无声地产生的话语(Alderson-Day and Fernyhough, 2015;Perrone-Bertolotti et al., 2014;Zivin, 1979)——是我们精神生活的一个核心方面;它与广泛的心理功能有关,包括阅读、写作、计划、记忆、自我激励和解决问题(Alderson-Day等人,2018;Morin et al., 2011, 2018;Sokolov et al., 1972)。人们对内在言语产生背后的神经过程知之甚少。

一个假说认为,内在言语是外在言语的一种特殊形式(Feinberg, 1978;弗里斯,1987;Jones and Fernyhough, 2007)。参与产生内在言语的大脑区域与参与产生外在言语的大脑区域相似,包括听觉、语言和补充运动区域(Aleman et al., 2005;McGuire et al., 1996;Palmer et al., 2001;Shergill et al., 2001;Shuster and Lemieux, 2005;Zatorre et al., 1996)。

根据外部言语的内在前向模型(Miall and Wolpert, 1996),当人们移动发音器官来说话时,会同时发出一个感知副本(Von Holst and Mittelstaedt, 1950),此副本形成了神经预测的基础——一种关于人类语音的时间和物理特性的必然放电(Sperry, 1950),它被用来抑制对这些声音的神经和感知反应(Crapse and Sommer, 2008;Straka et al., 2018)。

如果内在言语实际上是外部言语的一种特殊形式,那么它也应该伴随着一种时间上精确的、特定于内容的必然释放。本研究探讨了这一问题。

很多研究表明,内部言语伴随着一个必然放电。

与本研究特别相关的是Whitford等人(2017)进行的一项实验,他们介绍了一种程序,在该程序中,参与者观看了一个报时纸带式的线索,该线索为他们提供了关于何时会听到可听音素的精确知识。在实验的听力条件下,参与者被要求被动地听可听的音素;在内部言语条件下,参与者被要求在听到可听音素的准确时刻产生一个内部音素。在内部言语条件下的随机一半试验中,内部音素和可听音素在内容上匹配——这被称为匹配条件;在另一半的实验中,内部音素和可听音素在内容上不匹配——这被称为不匹配条件。Whitford等人(2017)发现,与被动倾听相比,产生内部音素会减弱事件相关电位(ERP)的N1分量(听觉皮层处理的一个指标),但只有当内部音素和可听音素在内容上匹配时才会减弱。如果内部音素与可听音素的内容不匹配,则N1没有衰减。这些结果表明,内在言语与外在言语相似(Behroozmand et al., 2009;Behroozmand and Larson, 2011;Eliades and Wang, 2008;Heinks-Maldonado等人,2005;Houde et al., 2002;Liu et al., 2011;Sitek et al., 2013),伴随着特定于内容的推论放电,因为它包含有关内部语音物理特性的信息。

但当我们移动我们的发音器官来说话时,伴随而来的必然放电不仅是内容特定的,而且是时间精确的,因为它包含了关于公开言语的时间特性的信息。这方面的证据来自研究表明,通过在发音器运动和听觉反馈之间施加时间延迟可以减少或消除n1衰减(Behroozmand等人,2010,2016;Chen et al., 2012;)。

在本研究中,我们调查了内在言语是否像外在言语一样,伴随着时间精确和内容特定的推论放电。为了完成这一任务,使用了Whitford等人(2017)提出的ticker-tape-style线索来控制被试产生内部音素的时间,并在被试产生内部音素前300ms、同时或后300ms呈现可听音素- -分别称之为前条件、精确条件和后条件。

实验1:比较了被动听时可听音素诱发的N1和不同时间延迟的内在言语的产生。

实验2:比较了在不同的时间延迟中,由可听音素引起的N1与内部音素匹配或不匹配。

本文假设内部语音伴随着时间精确和内容特定的必然放电,假设当内部音素的时间和内容与可听音素匹配时,n1衰减效应比不匹配时更大。

被试:

42名来自UNSW Sydney的学生。所有参与者报告双耳听力正常。3名受试者的数据,因为脑电图(EEG)记录中存在过多的伪影被排除在分析之外。最后的39参与者(20名女性,38名右撇子)的平均年龄为20岁。

实验程序及设计:

在每次试验中,参与者都观看一段动画:开始时,屏幕中间有一条绿色的水平宽带(自动报时带),屏幕中间有一条红色的垂直线(固定线),屏幕右侧有一条绿色的垂直线(目标线)(见图1a)。

图1

参与者被指示在试验期间注视固定线(保持静止)。延迟1 s后,目标线开始以6.5°/s的速度向左移动穿过屏幕,4 s后目标线与固定线重叠,随后继续在绿色水平宽带上移动1 s(见图1b-f)。每次试验结束后,参与者用5分李克特量表对自己在试验中的主观表现进行评分,得分范围从1分(表示完全不成功)到5分(表示完全成功)。使用这些评级来识别和分类参与者成功完成任务的试验。

实验由20个block组成,每个block有18个试次。一半的block为被动听条件:被试被动地听一段音素/ba/(见图1g)的录音,这段录音由一位男性产生,长约200毫秒,大约70 dB SPL。另一半block为内部言语条件:参与者听音素/ba/的录音,并在固定线和目标线重叠的精确时刻,在他们的脑海中无声地产生音素/ba/(见图1)。block的顺序在听和内心语言条件之间交替,并且开始block在参与者中是平衡的。

图2

在每个block随机抽取三分之一的试验中,可听音素在注视线和目标线重叠前300毫秒呈现-前条件(见图1i);在另外三分之一的实验中,可听音素在固定线和目标线重叠的精确时刻呈现——精确的条件(见图1j);在其余三分之一的实验中,可听音素在注视和目标线重叠300 ms后呈现(见图1k)。三个条件顺序是随机的,每个区块的顺序不同,每个参与者的顺序也不同。

被试:61名学生。由于脑电图记录中存在过多的伪影,6名参与者的数据被排除。最后共55名参与者(42名女性,52名右撇子),平均年龄为20岁。

实验程序及设计:

实验由20个block组成,每个block有18个试次。一半的block为内部语音/ba/条件:参与者在固定线和目标线重叠的精确时刻,在脑海中默念/ba/音素;另一半的block为内心言语/bi/条件:参与者在固定线和目标线重叠的精确时刻,在脑海中默念/bi/音素。

在每个block随机抽取一半的试次(匹配条件),内部音素和可听音素在内容上匹配(参与者发出音素/ba/或/bi/,并分别听音素/ba/或/bi/的录音,见图3a和b)。在另一半试次(不匹配条件),内部音素和可听音素在内容上不匹配(参与者产生音素/ba/或/bi/,并分别听音素/bi/或/ba/的录音,见图3c和d)。

与实验1类似,在匹配和不匹配条件下,随机抽取三分之一的试验,在注视线和目标线重叠前300毫秒呈现可听音素—前条件;在另外三分之一的实验中,可听音素在固定线和目标线重叠的精确时刻出现—精确条件;在其余三分之一的实验中,可听音素是在注视线和目标线重叠300毫秒后呈现的。试验的顺序是随机的,每个block的顺序不同,每个参与者的顺序也不同。