符号与心理程序:关于人类奇点的假设



文献:Dehaene, S., Al Roumi, F., Lakretz, Y., Planton, S., & Sablé-Meyer, M. (2022). Symbols and mental programs: a hypothesis about human singularity. Trends in Cognitive Sciences. https://doi.org/10.1016/j.tics.2022.06.010

1. 背景及本研究 ¶

自然语言一直被认为是人类物种认知奇特点,然而本研究认为认为人类拥有多种内部思维语言,类似于计算机语言,编码和压缩不同领域的结构(数学、音乐、形状…),这些语言与平常的语言具有不同的皮层回路,其特点是:(i)使用一小组符号对域进行离散化;(ii)递归地组合成心智程序,对嵌套的重复和变化进行编码。在基本形状或序列感知的各种任务中,语言中的最小描述长度(MDL)捕捉人类行为和大脑活动,而非人灵长类动物的数据由更简单的非符号模型捕捉。本研究支持人类思维的离散符号模型。

2. 人类对象征性结构的普遍偏好 ¶

早期智人留下了很多线条等抽象的形状痕迹,但即使是与人类有过接触的非人灵长类动物,从来没有画出这种类似的抽象的几何形状。因此,人类是不同的,即使在不涉及交流语言的领域,如绘画和几何。作者把这些观察称为“人类认知的奇特点”。对于人类的独特性已经提出了许多假设,包括一种特殊的类比能力、心理理论、教学、文化记忆或个体间的交流。

本研究假设这种看似简单的画之字形的能力指向了一种深刻的认知差异,这种差异可能影响了所有上述能力,为什么人类是唯一一个不仅发展了口头和书面语言,还发展了科学、音乐、数学、视觉模式等语言的物种?作者认为,在每一个能力领域的背后,都隐藏着一种特定的人类心理表征模式:离散的符号及其在递归语言中的构成,让人类这个物种能够从非常小的一组初始原语中构建出任意复杂的心理结构。Charles Sanders Peirce提出signs(任意的,约定俗成的)分为三种:icon(例如,飞机的图案作为机场的标志), index(例如,动物听到铃声代表食物要来了、动物之间的交流), symbol(能够与其他符号建立句法关系以形成一个系统或语言的符号,并不是孤立存在的,而是在一个符号系统中,例如language就是由基本的symbol组成的符号系统),本研究作者认为人类的独特性归因于 symbol。

在实验中,使用最简单的感知范式,例如我们如何看一个正方形,感知一个二进制的节奏,或画一个之字形,在人类中也是不同的,人类只能用离散和组合的心理表征方式来解释。虽然其他动物也能感觉到正方形和圆形之间的区别,但如果此研究假设是正确的,那么动物只会使用经典的视觉识别机制,而人类也会使用类似于编程语言的逻辑递归表征模式。这与Tecumseh Fitch提出的强调人类认知倾向于树形递归结构的经典理论相关。本研究不认同的点是:句法结构似乎没有单一的多领域能力或核心脑回路。相反,有证据支持存在多个并行的大脑回路,这些回路承载着具有部分不同编程风格和特定领域原语的语言(图2)。在口语和书面语句法所激活的区域与支持音乐、数学或形状语言的区域截然不同。但是,这些“语言”在抽象层级上共享几个同样的属性(将离散的symbol元素进行递归组合和压缩),但彼此又不相同,例如,捕捉几何和二进制序列的语言强调重复和对称,而许多语言学家强调自然语言如何避免重复并依赖反对称性。

下面先回顾3个发现人类用思维语言部署心理程序证据的不同领域,分别是:空间序列、声音的听觉序列和视觉形状。

图1

Corsi 积木模板任务中,实验人员先后随机点击位于受试面前的几何形状,然后受试以正确的顺序重复实验人员的点击,当空间规律呈现时,就会促使工作记忆。为了探索什么因素决定了空间序列的感知规律性,在一个研究中,给儿童和成人展示了以不同顺序描绘八边形顶点的序列,因此所有序列的长度都是8,这超过了典型的工作记忆容量。结果是对于非结构化序列,错误率超过50%,然而,一旦序列包含了诸如弧线、之字形、正方形或直角等几何结构,表现就会好得多。

那么他们使用了何种规律呢?总结为三种类型:旋转(围绕八边形的中心旋转)、对称(围绕八边形的四个轴中的一个)和重复(可能有变化)。这些指导可以串联或嵌套在一起,用类似计算机的语言创建“心智程序”(如下图3)。正方形被编码为围绕八边形旋转90°的四次重复,因此,两个正方形的序列被编码为这四次重复的两次重复,几何语言可以将八边形上的任何空间序列编码为递归嵌入的一系列这样的指令。

图2

一旦这种语言恰当的形式化,就可以准确的预测受试的工作记忆和预期。关键的预测因素是表征序列所需的心理程序的复杂性(例如,最短描述长度, minimum description length (MDL))。思路很简单:在没有语言的情况下,八个位置的序列需要八个工作内存槽。但是几何语言允许压缩序列,利用其规律性使其记忆表征更加紧凑。与其列出之字形的八个位置,这样描述更高效:“重复四次对称操作,同时沿八边形移动起点+1。

MDL原则也称为简单性原则,已经被宣布为心理科学的基本统一原则,事实上,MDL预测了人类在许多其他领域的表现,从数字广度到概念学习。这个概念起源于算法信息论,其中一个叫做Kolmogorov复杂度的数学量是能产生一定输出的最短程序的长度。

研究使用脑成像来收集支持假设的思维语言的直接证据,并识别潜在的神经回路。MDL调节大量双侧枕顶背侧、前额叶和尾状核区域的活动(图 3D),并且激活不仅随着MDL增加,而且当序列超过MDL的临界水平时,激活减少,这表明无法找到紧凑的程序(这个结果与口语描述结果类似)。因此,这些区域的活动反映了假定的几何语言代码的结构。

虽然功能磁共振成像信号汇集了整个序列,脑磁图提供了序列本身内部编码的直接证据。每一个序列,解码顺序信息的频谱在对应于预测分组的频率处显示出峰值(图3E),类似于语言,将空间序列解析为嵌套的组成结构或短语。也就是说解释人类对空间序列的记忆需要几何学的语言,并且fMRI表明这种语言不依赖于例如额下回(布罗卡区)或颞上沟的人脑的经典语言区,数学语言可以从解剖学和功能上与沟通中的口语或书面语分离,例如,在正常受试者和大脑受损患者中:语法缺失性失语症患者仍然可以做代数。

那么嵌套重复的概念是否可以推广到听觉序列的领域,限制在只用两种声音的二进制序列上(A和B),这种情况下语言变得非常简单,与前一项相同或不同,即AA或AB(这里的A可以指代声音或者位置等),原语的嵌套重复会生成长而可压缩的序列,如AABBABABAABBABAB,图4显示了各种这样的序列,长度都是16,根据预测复杂度(MDL)排序。

图3

通过给被试呈现语音序列,然后让他们监测偶然出现的偏差刺激让他们习惯并测试记忆,结果和几何学一样,MDL线性预测了入侵者任务的响应时间和错误率,MDL越大,精神负荷越重,因此对意外声音的反应能力越低。

在预测编码框架内,假设大脑使用建议的语言作为内部模型来预测即将到来的项目,会得到两个简单的预测: 与模型编码相关的大脑信号应该随着序列复杂度(MDL)而增加。 与预测误差(由异常声音引起)相关的大脑信号应该随着MDL而减少,因为随着复杂性的增加,这些声音越来越难以预测。

这两种预测在 fMRI 和 MEG中都得到了证实,fMRI定位了双侧区域网络的影响,包括听觉皮层(双侧颞上回)、运动前区(与背侧BA 44交界)和前顶叶内区(图4D),后者与之前涉及几何语言的激活区域有重合,并且还与用于基本算术的特定主题的激活区域相交,因此暗示了它们对重复功能的假定贡献,但是这次与涉及声音表征的高级时间区域相结合。在对自然语言敏感的区域中,在左BA 44和左后上颞叶皮层中,与受试者特定的大脑皮层只有极少量的重叠。这些关于基本音调序列的发现与更广泛的发现相一致,即音乐和语言需要很大程度上不同的、可分离的大脑回路

前两个领域涉及序列(视觉空间或听觉),因此在这方面类似于口语,那么是否还需要一种思维的符号语言来解释静态的几何形状。关于这个想法有两个测试。

首先,他们创造了一个静态的入侵者测试,受Dehaene, S., Izard, V., Pica, P., & Spelke, E. (2006).研究的启发,在这个实验中参与者必须在五个重复的相同基本形状中找出一个异常的形状,例如基本形状可以是一个矩形(大小和方向有所不同),而偏差形状是右下角被移动的同一个矩形(图5A),测试了11种四边形形状。尽管在定量应用相同的偏离量时非常小心,但还是出现了很大的几何规则效应:当基本形状具有几何规则(平行边、等边、直角或等角)时,偏差检测比不规则四边形更容易。这种效应是由形状的复杂性决定的,而形状的复杂性可以通过对这些符号属性的简单计数来估计(图5B),有可压缩规则性的正方形、长方形、梯形或平行四边形比没有这些性质的随机四边形更容易编码。一系列的实验证明这种几何规则效应是高度可复制的,在经典的连续搜索任务中,或者甚至当角点位置出现在序列中时,从而与本研究先前的序列工作相衔接。这种效应在学龄前儿童和很少或没有受过正规教育的成人身上得到了复制,表明它独立于教育。正在进行的fMRI研究表明,这种效应可能来自右前顶叶内皮层。

图4

研究试图把这项工作推广到四边形以外的形状,找到一种改进的几何语言,可以解释世界各地文化中证实的形状,包括之字形,也包括圆形、螺旋形、阵列形、中楣形等。

3. 非人灵长类动物无法掌握这些语言 ¶

狒狒对几何规则不敏感,与人类不同,他们处理正方形和矩形的方式与其他不规则四边形没有什么不同,符号模型没有捕捉到他们反应的任何变化,腹侧视觉通路的经典卷积网络模型很好地预测了他们的行为(图5BC),然而这在受过教育的人群中基本不起作用。这两种模型的混合为学龄前儿童和未受教育的成年人的表现提供了最好的解释。

因此,有两种策略可以用来解决几何偏差刺激的任务:一种知觉策略,适用于所有灵长类动物,在腹侧视觉系统中处理几何形状,就像任何图片或面孔一样;还有一种象征性的策略,似乎只有人类可以使用,根据离散的、象征性的“重复的重复”(对称),几何形状被压缩,有研究结果表明猕猴甚至不能理解最简单的序列模式。