超过单词处理语言的神经生物学



文献:Hagoort, P. (2019). The neurobiology of language beyond single-word processing. Science366(6461), 55-58. https://doi.org/10.1126/science.aax0289

语言是生物和文化的结合体,要理解它复杂的组织和神经生物学基础,需要将语言技能分解为基本的构建模块和核心运算。基本构建模块包括在发育过程中获得的关于说话者所掌握的一种或多种语言的声音模式、词汇的含义、句法特征(如名词、动词)以及拼读模式(阅读)的知识,或者聋人的手势。除了这些基本的语言单位(elementary linguistic units, ELUs),还有基本的语言运算(elementary linguistic operations, ELOs),使在记忆中检索 ELUs(例如在单词识别中),或者从这些基本构建模块中生成更大的结构。此外,通过结合ELUs和ELOs创建的命题必须与它所嵌入的实际或想象的情况相联系,以便建立它的真值。例如,如果我说“杂志的编辑喜欢这篇文章”,就产生了一个无可挑剔的句子,但是只有当名词“编辑”、“杂志”和“报纸”可以与特定的标记联系起来时,人们才能知道我说的是真是假,这些都只是语言复杂性的一部分。 虽然语言如此复杂,但是大多数儿童在出生后的前几年在没有正式指导的情况下就获得了语言能力的核心方面,这远早于他们学会系鞋带以及简单算术之前。这表明大脑的基本构造为儿童提供了习得某种语言的准备。由Wilhelm Wundt提出的树状结构的表现形式,与等级观念有着错综复杂的联系,体现在词的形态构成和短语的层次解释等方面,如下图1,这种等级结构不局限于语言。

图1

]]

1. 经典理论及缺陷 ¶

很长一段时间里,对语言的神经生物学基础的认识来自于19世纪末20世纪初神经学家的观点(如Broca区和Wernicke区),根据这个经典理论,认为语言能力主要位于左外侧裂皮质,额叶和颞叶之间有严格的分工,认为左侧颞叶的Wernicke区主要负责语音的理解,而左额下的Broca去主要负责言语的产出,由弓形纤维束连接这两个区域。虽然这个模型仍然有影响力,但它被证明有严重的局限性,而且在很大程度上是错误的。主要有以下几点:①Broca区和Wernicke区界限不清,不能构成自然的神经解剖学要素,并且它们被进一步分成具有不同细胞结构特征和受体结构的多个区域;②功能磁共振成像(fMRI)和病变研究表明,语言相关皮层比想象的要扩展得多,包括颞叶的大部分区域以及顶叶的部分区域,并且语言也并不是严格的左侧化(如下图2);③Broca区和Wernicke区都参与语言的理解与产出;④语言皮质之间的连接比经典模型假设的多,不局限于弓状纤维束;⑤有研究证实小脑和皮层下结构,如丘脑和基底神经节也起着重要的作用,特别是对说话的时间和顺序的微调。经典观点主要是基于单个词的加工的,缺少关于语言组合机制的观点,这也解释了为什么经典观点大脑其他区域和纤维束对语言的重要性。

图1

以新的方式组合单词的能力是人类语言的标志,这种组合是通过Broca区和LIFC中邻近皮质与颞叶和顶叶皮质之间的动态相互作用来实现的,这些区域之间的相互作用保证了从记忆中检索到的词汇信息被统一成具有总体句法结构和语义解释的连贯的多词序列。

2. 神经可塑性 ¶

与语言相关的皮层在某种程度上是可变的,最近的研究表明,在某些情况下,经典的外侧裂区以外的皮层可能会被涉及。语言处理发生在先天失明个体的枕叶皮层,虽然结果有待证实,但是有证据表明视觉皮层的募集与言语记忆任务中的行为表现有关。并且,先天失明者的视觉皮层对有句法移动的句子有反应,但对数学方程式的难度没有反应,这一结果支持了该区域有助于句法结构计算的假设。如果特定大脑区域的输入模式发生变化,这个区域可能会被募集以执行完全不同的功能。基于这些和类似的发现,Bedny得出结论:“人类大脑皮层具有认知多能性,也就是说,能够承担广泛的认知功能。大脑区域的特定化是受到发展过程中输入的驱动的,而输入又受到连接性和经验的制约。还未理解语言的基本构件和基本运算与人脑的神经结构之间的映射关系,语言的神经生物学基础结构中的个体差异程度在很大程度上仍然是一个未知领域。

3. 即时性原则 ¶

由于神经生理学测量的高时间分辨率,语言处理动力学的关键特征已经有了更清晰的图像。语言处理速度惊人,很轻松就能在1s内产出和理解两个到五个单词。在产出和理解过程中追求速度的结果是,在检索语言基本构建模块和组合运算时是递增的。并且,语言处理的特点是“即时性原则”。在理解中,语言和非语言信息一旦可用就立即被使用。也就是说,关于语境、伴随信息(如伴随的手势)以及说话者的知识会立即在结合单个单词含义的同一个快速反应的大脑系统上发挥作用,所有可用的相关信息都将被毫不延迟地用来共同确定对说话者信息的解释。在所有情况下,与颞顶区动态互动的LIFC在整合决定语音理解的不同信息来源中起着重要作用。

虽然没有确凿的证据表明预测对于理解是必要的,但预测有助于语言处理。很可能,词汇、语义和句法线索共同预测下一个预期单词的特征。上下文预测和自下而上分析输出的不匹配导致大脑立即招募额外的处理资源以挽救在线解释过程。

4. 信息结构 ¶

在说话者和听话者之间的互动过程中,他们之间谈论的主要内容称为“topic”,新信息是关键部分称为“comment”,信息结构是指topic和comment在句子中的组织方式。讲话者通常会注意标记包含新信息的焦点成分,不同的语言有不同的实现方式,一些语言使用句法位置一些语言使用韵律(重音)进行标记。

图1

在功能磁共振成像和电生理读数中,发现信息结构调节语言相关的激活。例如,如果它们是焦点成分的一部分,意外的语义和非法的句法分别导致相当大的N400和P600效应,如果是非焦点成分的一部分,这些影响就会大大减少甚至消失(如图3)。有研究表明音高重音标记的新信息激活了一般注意网络领域。

5. 语用推理 ¶

虽然外侧裂皮层的区域,特别是左半球,对于编码和解码命题内容很重要,但这不是全部。话语的意义很大程度上依赖于语境信息,而语境信息并不实际编码在话语中,单词和语言结构中的编码决定了它的意思和意图。提取预期的意义需要在假设交互主体的信念和意图以及对适当的语言使用的共同理解的基础上做出推论。例如,在合适的上下文中,“这里很热”这句话不仅会被解释为对事态的陈述,而且首先会被解释为对此做点什么的隐含请求(比如打开窗户等),语言的社会约束力和交际作用主要取决于做出正确的语用推理的能力。目前为止,除了单词检索、句子句法和语义的核心语言机器之外,相对较少的研究调查了有效交流的神经基础设施。语用推理依赖于心理理论网络中核心区域的贡献。这些区域包括右颞顶结合部和内侧前额叶皮层,这些区域通常涉及需要精神状态推理的任务——即思考他人的信仰、情感和欲望。例如,在一项研究中,作者在一幅图片面前向参与者展示句子。一种情况下,结合图片的句子可以被解释为间接的行动请求。其中一个项目是一个项目将“这里很热”的话语和一扇门的图片结合在一起。被试将此理解为要求开门,而同样的话语加上沙漠的图片被解释为一个陈述。处于间接请求条件下的句子比没有可能把它们解释为间接请求的相同句子更强烈地激活了ToM网络。

6. 多重网络观点 ¶

研究语言神经生物学的一种方法是从识别语言的本质开始。一旦确立语言在动物中脱颖而出的几个核心特征,就知道人类大脑组织的哪些方面造就了语言的本质。比如,如果递归是人类语言的关键成分,那么Broca为这种独特的能力服务。此观点基于这样一种信念,即区分言语和语言的本质和非本质方面无助于解释人类语言技能的全貌。第一步,需要将复杂的语言技能(如说和听)分解为ELUs和ELOs,作为编码和解码命题内容的关键构件。这些主要由LIFC和大部分颞叶皮层和顶叶皮层支持,具有左半球偏向性。与注意控制的相互作用——需要多重需求系统来上调对标记为comment或新信息的话语成分的处理。此外,需要将话语内容集成到跨越多个连接话语的情境模型中,这一过程似乎涉及右侧额下回和右侧角回。最后,为了从语言话语提供的编码意义中提取出想要表达的信息,听者必须整合语言和非语言信息,她还必须得出所需的语用推理。除了从记忆中检索词汇信息的核心区域以及在产出和理解多词话语中词汇构件的统一,还需要其他大脑网络来最大程度地实现语言驱动的交互。多个大脑网络的贡献将不是语言特定的,而是与其他认知功能共享。ELUs几乎肯定是特定领域的,但是ELOs的一些关键方面很可能与其他领域共享,比如音乐和算术。一个比经典模型更复杂的相互作用的大脑区域的图像出现了,因为理解语言不仅仅是单个词的处理,更多的不仅仅是进入初级感觉皮层的声学或拼写符号中给出的信息。