量子认知研究概述



论文信息 ¶

Huang, J., Epping, G., Trueblood, J., Yearsley, J. M., Busemeyer, J. R., & Pothos, E. (2025). An overview of the quantum cognition research programme. PsyArxiv.

关键词 ¶

量子认知

摘要 ¶

量子认知研究涉及量子概率论在认知建模中的应用。量子认知模型已应用于心理学的多个领域,本文提供了一个具有代表性的概述,涵盖感知、记忆、相似性、概念过程、因果推理、判断中的建设性影响、决策顺序效应、决策中的连接/分离谬误以及其他判断现象。

3.量子结构是如何从经典大脑中出现的? ¶

像量子过程可以在经典计算机上编程一样,因此我们假设认知层面的量子过程可以从经典脑神经生理学中出现。一些研究人员试图指定认知中量子结构的神经生理学或其他起源。

一个想法与 Suppes 等人 (2012) 的神经振荡器提案有关,该提案涉及同步神经元的振荡模式如何对应于刺激、响应关联,且有证据表明神经元之间放电率的同步可能与认知处理有关。神经振荡器具有波状特性,因此会产生由振荡器之间的相位差引起的干扰图案。一个关键问题是:是否存在除波动行为可产生干涉图样之外的、支持量子结构存在的证据。

Busemeyer 等人(2015 年)表明,量子计算可以用标准神经网络来实现。该神经网络实现了三个步骤:通过幺正演化计算振幅、将振幅转换为概率,以及进行状态坍缩。

Beim Graben 和 Atmanspacher 考虑了如果问题的描述粗糙,那么经典问题之间有时会出现不相容性,以至于问题对可能的结果有一些不可简化的模糊性。一个问题是,产生不相容性所需的那种粗糙性是否出现在问题的心理表现方式中。

Aerts 和 Sassoli de Bianchi(2015)提出,认知中的量子概率规则是由“平均”过程产生的。假设一个典型的决策实验,参与者被要求为某些事件分配概率。假设不同的参与者使用不同的概率规则——需要注意的是,尽管不太可能每位参与者都有自己完全独特的一套概率分配系统,但更为合理的情况仍可被视为这一通用假设的特殊情形。分析数据的研究者通常会对所有参与者的结果进行平均。Aerts 和 Sassoli de Bianchi(2014)的观点指出这种平均将等同于量子概率分配规则,这也正是为什么量子理论在认知应用中表现出成功的原因。

4.量子认知模型是否比经典模型更复杂? ¶

量子概率论:问题有相容和不相容两种类型;但是在经典概率论中,问题只有一种相容的类型.量子认知模型通常采用不相容的问题,因此复杂性的比较应在一个使用不相容问题的量子模型与一个在整体结构上相匹配的经典模型之间进行。复杂性的问题实际上取决于量子或经典模型的构建质量。随着任务复杂性的增加,量子模型由于能利用“不相容性”,在保持建模能力的同时保持较低的复杂度,因此在某些情况下比经典模型更高效。

5.实证研究 ¶

已经识别出一些在感知、记忆、相似性、概念加工、因果推理、判断中的建构性影响、决策顺序效应、决策中的合取/析取谬误以及其他判断现象中具有代表性的量子模型。核心问题是,量子模型是否只是为了对已有结果提供一个看似更好的解释,还是已经被用于生成新预测和新发现。量子模型引入心理学的主要方式是针对概率推理中的一些结果,例如合取谬误(conjunction fallacy),这是在经典概率推理框架下被认为是错误的,但在量子推理下可以被认为是“正确的”

本节讨论两项与双稳态知觉有关的研究,双稳态知觉出现在一些模棱两可的图形中,例如Necker立方体,这种图形可以被以两种不同的方式感知,每种方式对应着对图形的不同解释。

Conte 等人(2009)采用了一种实验范式,其中依次呈现两个模棱两可的图形(每个图形都可以以两种不同的方式被感知),或只呈现其中一个图形。

Atmanspacher 和 Filk(2010)探讨了双稳态解释在不同时点之间变化的一致性问题。

Conte 等人(2009)认为,他们在双稳态知觉实验中观察到的对全概率定律的违背,表明与每个图形解释相对应的心理状态是叠加态,因此可能会出现干涉效应。

Atmanspacher 和 Filk(2010)提出的双稳态知觉量子模型,明确描述了处理双稳态刺激时的动态过程,重点在于心理状态的衰减如何与观察刺激的动态相互作用。该模型包含两个部分:一部分对应于在未观察刺激时心理状态的变化,另一部分被称为认知更新过程,即因观察刺激而引起的心理状态变化。衰减过程与哈密顿量(Hamiltonian)相关,而观察过程则与对刺激解释的确定相关。只要哈密顿量与观察算符不对易(因为如果它们对易,则系统的动态就是平凡的),原则上就有可能违反时间贝尔不等式。

对于 Conte 等人(2009)而言,有一个普遍性观点适用于所有表面上与经典概率理论不一致的结果,包括对全概率定律的违背(例如:合取谬误、析取谬误、析取效应)、问题顺序效应,以及任何上下文相关性效应。

在经典理论中对“心理框架”(如 frame of mind)进行条件化,意味着假设心理加工是具有关联上下文的(contextual)。而上下文相关性(contextuality)正是量子理论解释此类结果的核心方式之一:如果问题 A 和 B 是具有上下文性的,那么**先处理 A 问题会为后续处理 B 问题创建一个特定的语境,而这个语境与先处理 B 问题时的语境是不同的。

Bruza 等人(2009)提出了一种适用于检测提示回忆记忆中贝尔不等式违反的实验设计:提示回忆实验所用的提示词可能具有多重语义,(例如“bat”可以表示动物或运动用具),实验被分为若干部分,在每一部分中,提示词会与激活其不同语义的词语一起呈现,在学习阶段结束后,被试会被单独呈现两个提示词,并被要求回忆刚刚学习过的列表中的其他词语。研究者通过分析被试回忆的词语来判断提示词激活了哪种语义。

过度分配效应(Overdistribution Effect):在记忆研究中,超分配效应指的是当测试项目与多个不同的上下文或类别相关联时,记忆的准确性或回忆率会降低的现象。

记忆过度分布效应(memory overdistribution effect):

被试首先需要记忆一组目标项目,在测试阶段,被试会看到以下三类项目:

目标项(T):也就是之前学过的单词;

相关干扰项(R):与目标项在语义上相关但未曾呈现过的单词;

无关干扰项:与目标项语义无关、也未曾出现过的单词。

在识别测试中,对被试的指令可以和测试项目进行因子式组合,用 T 表示目标项、R 表示相关干扰项,并引入关于它们的析取项(T ∪ R)和边际项(T、R)的探测,那么一个关键的实证发现是:

识别概率满足:Prob(T) + Prob(R) > Prob(T ∪ R),这被称为析取谬误(disjunction fallacy),也叫做情景记忆过度分布。

subadditivity effect(次加工效应):当某项被归类为互斥且完备的多个类别中时,其被接受的总概率超过 1,即使没有明确出现“T ∪ R”的线索,我们仍观察到:Prob(T) + Prob(R) > Prob(T ∪ R)。

**QEM(quantum episodic memory model)**2013年提出:

实验测试中的每个项目都被表示在一个五维 Hilbert 空间中:其中三个维度对应于三个列表的逐字特征(verbatim features,主要是表层特征),一个维度对应于要旨特征(gist features,主要是语义/抽象特征,也包括关系性和上下文信息),还有一个维度对应于干扰特征(distractor features)。

2015年Brainerd 等人进一步扩展了该模型,其作为模糊痕迹理论的形式化表达,我们将其简化地称为 QEM+。

在QEM+中,每个项目被表示在一个三维 Hilbert 空间中,其基向量分别对应于逐字信息、要旨信息和其他信息(即不匹配线索的表层或语义内容的信息)。

Complementary Memory Types (CMT)互补记忆类型模型:逐字信息和要旨信息被建模为“不相容”的(incompatible),即它们不是可以同时精确测量的,对其中一个的完全掌握会引入对另一个的某种不确定性,对要旨信息的表征做出了对称性假设。在一个四维空间中,有三个基向量分别对应于实验中所记忆的三个列表的逐字信息,另一个基向量对应于无关信息。

Generalized Quantum Episodic Memory Model (GQEM)广义量子情景记忆模型:逐字信息(verbatim)、要旨信息(gist)以及新信息(new information)被假定为互不相容,首先基于要旨信息来评估是否接受信息;如果要旨信息的判断结果为“不接受”,则再基于逐字信息重新评估是否接受。

QEM+模型明确预测的是“次可加性”而非“超加性”,而且那些增强对要点(gist)信息依赖、或减少字面(verbatim)信息影响的实证操控,会提升次可加性效应的强度。QEM 和 QEM+ 模型在简洁性方面十分优雅,但对量子特性的运用有限,这引发了人们对使用量子理论必要性的质疑。

CMT通过引入字面信息与要点信息之间不相容(incompatibility)的假设来扩展模糊痕迹理论(fuzzy trace theory,这一观点)可以说是量子模型在该领域中更具意义的贡献之一,但是模型中所作的对称性假设(symmetry assumption)却较难被合理地解释或证明其合理性。

过度分配模型(Overdistribution Model):这是一种用于解释超分配效应的理论模型。它试图通过数学或逻辑框架来描述和预测当测试项目与多个上下文相关联时,记忆表现的变化。该模型可能考虑了记忆编码、存储和提取过程中的复杂交互作用,以及不同上下文对记忆检索的影响。