文献:Oaksford, M., & Chater, N. (2009). Précis of Bayesian Rationality: The Probabilistic Approach to Human Reasoning. Behavioral and Brain Sciences, 32(01), 69–84. https://doi.org/10.1017/S0140525X09000284
1.贝叶斯理性和概率 ¶
传统西方认为:理性涉及根据逻辑规则进行的推理——一种形式化的理论,它规定了在命题之间具有确定性的推理联系。
贝叶斯理性认为:理性是由对不确定性进行推理的能力来定义的。尽管人们通常不擅长关于概率的数值推理,但人类思维对定性贝叶斯概率推理的微妙模式很敏感。
一般来说,认知,尤其是人类日常推理,最好被视为解决概率问题,而不是逻辑推理问题。
有人认为,从概率的角度可以更好地理解据称“逻辑”的推理问题,揭示明显的非理性行为。来自条件推理、Wason 的选择任务和三段论推理的数据是通过概率地重铸这些问题来捕获的。概率方法做出了各种新的预测,这些预测已经被实验证实。这本书考虑了这项工作的影响,以及认知科学和人工智能中更广泛的“概率转向”,以理解人类的理性。
- 为什么是“贝叶斯”理性,而不仅仅是“概率”理性?
因为贝叶斯方法的关键是利用了对概率的特定解释,而不仅仅是概率本身的数学。概率论不是用于解决关于世界上物体的数学问题的演算,而是用于理性更新信念的演算。
1. 逻辑与西方的心灵概念(conception of the mind) ¶
逻辑旨在指定绝对确定的推理关系:逻辑推理是保真的,也就是说,如果前提为真,则结论也必须为真。这里的“绝对确定”在推论中是不可能的。
用三段论举例,All A are B; All B are C; there- fore, All A are C。
这只提供了一种推论结构,如果相信前提,那就会相信结果。逻辑可以被视为对任何理性主体可以接受的思想提供关键约束。
- 亚里士多德理论
确定了64种三段论的形式。
尽管亚里士多德的逻辑是根据口头陈述的论证模式(从日常语言转换为适当的形式结构)来定义的,但将逻辑的主要主题视为思想本身是很诱人的。如果思想被视为由理性思维构成,而逻辑捕捉到理性思维的模式,那么将逻辑视为心理学的核心部分似乎是很自然的。
理性思维受逻辑支配的观点,称为逻辑主义的心灵概念。
皮亚杰:头脑能够根据特定的形式逻辑系统进行推理:命题逻辑
乔姆斯基:语言的句法结构如何组织在演绎逻辑系统中,由此可以生成语言的所有且只有语法句子。而在成人推理心理学中,这种逻辑思维概念再次被用作解释人类思维的基础。
Wason:在实验中发现了系统性的不合逻辑
心理逻辑观:人类推理涉及对符号表征的逻辑计算。
心理模型理论:推理涉及对逻辑公式的形式运算,而是假设人们对公式为真的情况或“模型”的具体表示进行推理。
关键问题是:能否对人类推理的这些令人费解的方面提供更合理的解释?Oaksford认为贝叶斯方法正好提供了这样一种选择。
2.理性与理性分析 ¶
- 理性分析
- 准确地指定认知系统的目标。
- 开发系统适应环境的正式模型。
- 对计算限制做出最小的假设。
- 推导给定步骤 1-3 的最优行为函数。(这需要使用理性规范进行形式分析,例如概率论、逻辑或决策论。)
- 检查经验证据,看看行为函数的预测是否得到证实。
- 重复,反复提炼理论。
理性分析的核心目标就是从认知系统的角度理解问题的结构,即理解大脑试图解决什么问题。
- 贝叶斯理性分析的2个警告
理性分析并非旨在成为心理过程的理论。也就是说,它没有指定用于执行此解决方案的表示或算法。
理解人类推理结构的目标,无论是从逻辑还是贝叶斯角度,都应该与衡量人们在逻辑或概率问题上的表现的目标区分开来。
3. 现实世界中的推理:有多少推论? ¶
逻辑为某些推理提供了一种演算——从给定的前提中找到必然得出的结论。但在日常生活中,人们经常被迫使用零碎的知识,每一个知识都可能只是部分相信。日常推理似乎更像是一种试探性的猜想,而不是无懈可击的论证。
- 单调性:
一个成功的逻辑论证不能被任何可能添加到前提的附加信息推翻。学习新信息的时候会怀疑前提,但不会怀疑随之而来的结论。经典逻辑的这种特性被称为单调性,这意味着添加前提永远不会推翻现有的结论。
- 非单调性:
真实世界中通常是非单调的:如果获得了额外的信息,几乎任何结论都可以被推翻。这种额外信息提供了不确定性。
日常推理的非单调性对于将逻辑方法应用于建模思维来说是有问题的。非单调推理在逻辑上无效,因此不属于标准逻辑方法的范围,超出了演绎逻辑的范围。
e.g if you put 50p in the coke machine, you will get a coke. and I’ve put 50p in the coke machine, to I’ll get a coke.
- 肯定前件
然而,在常识推理的背景下,这个论点似乎根本不是单调的。有无数可能的其他因素可能会阻止这种推断。比如机器故障、机器里是空的等情况。
从逻辑的角度来看,毕竟我们只能从真实的前提中做出推论;如果一个逻辑论证的一个或多个前提是错误的,那么它什么也不会告诉我们。
日常推理的非单调、不确定性与逻辑的单调性之间似乎存在根本的不匹配;这种不匹配更广泛地诊断了基于逻辑的推理理论和逻辑主义认知科学的基本问题。
4.概率转向(The probabilistic turn) ¶
日常推理的不确定性、非单调性:我们的信念,无论是来自感知、常识思维还是科学分析,都是试探性的和临时性的。
如果日常推理本质上是概率性的,那么这就增加了自然语言陈述应该被解释为做出概率性而非逻辑性声明的可能性。
跨越广泛领域的“概率转向”——从试图将逻辑方法应用于不确定推理,转向通过应用概率论来处理不确定性。
*5.例外是否证明了规则?人们如何用条件句进行推理 ¶
人类推理的3个核心领域:条件句、数据选择、量化的三段论推理。这些模型背后的关键是 条件概率P(q|p)。
目的是表明,从逻辑主义者的角度来看,看似“错误和偏见”的东西,从贝叶斯的角度来看,往往是完全理性的。
条件句推理的4种模式:肯定前件MP、否定后件MT、否定前件DA、肯定后件AC。
- 双条件句:if p then q 也意味着 if q then p,可交换?,在逻辑上无效,但可能在某些情况下是语用推理。
贝叶斯方法只调用概率论。条件推理的概率解释背后有四个关键思想。
等式: P(if p then q) = P(q|p)。
概率被“主观地”解释为信念程度。
条件概率由称为“拉姆齐检验”的心理过程确定
当范畴前提不仅是假设的,而且实际上被相信或已知为真的时,我们如何推理。这个过程被称为条件化。
条件化 ¶
条件化被应用:当我们已知前提/对这件事有高信念度。
If it is sunny in Wimbledon, then John plays tennis,
and It is sunny in Wimbledon, therefore, John plays tennis.
当我们知道(而不仅仅是假设)It is sunny in Wimbledon时,条件化适用;或者当可以为该事件分配高度的信念时(例如,因为我们知道附近的布卢姆斯伯里是晴天)。通过条件化,我们对John plays tennis.的新信念程度应该等于我们先前的信念程度,即If it is sunny in Wimbledon, then John plays tennis(这里的“先前”是指在得知It is sunny in Wimbledon之前)。
通过方程,我们知道 P~0~(If it is sunny in Wimbledon, then John plays tennis)等于 P~0~(John plays tennis | it is sunny in Wimbledon),其中“ P~0~(x)”是 x 的先验概率.当我们得知It is sunny in Wimbledon,那么 P~1~(It is sunny in Wimbledon)= 1,其中“P~1~(x)”是 x 的 后验概率。̧条件化这些知识后,我们的P~1~(John plays tennis)的新信念度,应该等于 P~0~(John plays tennis | it is sunny in Wimbledon)。也就是说,P~1~(q) = P~0~(q|p),其中 p = it is sunny in Wimbledon,而 q = John plays tennis
从概率的角度来看,MP 提供了一种更新我们对后件 q 的信念程度的方法,因为它知道前件 p 是真的。
如果你认为 P~0~(John plays tennis | it is sunny in Wimbledon) = 0.9,那么假设你发现P~1~(It is sunny in Wimbledon)= 1, 你的新信念度是P~1~(John plays tennis)= 0.9。这与相信条件前提必然导致结论为真的逻辑方法形成对比,因此 P~0~(John plays tennis | it is sunny in Wimbledon)= 1。
以AC为例,如果温布尔登是晴天,约翰打网球那,约翰打网球,那么温布尔登是晴天。
在这种情况下,一个人知道或坚信约翰打网球(也许是从一个非常可靠的消息来源),所以 P~1~(q) = 1。但是使用贝叶斯条件化来推断一个人的新信念程度是温布尔登阳光明媚,P~1~(p),一个人需要知道一个人的有条件的信念程度,即P~0~(p|q)。AC 的条件前提和 MP 一样,是关于 P~0~(q|p) 而不是 P~0~(p|q)。
同样的方法也适用于相关概率分别为 P~0~(¬q|¬p) 和 P~0~(¬p|¬q) 的 DA 和 MT。 AC、DA 和 MT 的条件前提不能确定适当的条件概率这一事实标志着与 MP 的显著不对称。对于这些推论,需要进一步的知识来推断相关的条件信念程度。
概率论可以在不进行实用推理或诉诸过程限制的情况下捕捉不对称性。但概率模型没有捕捉到推理不对称的大小,它低估了 MP – MT 不对称性并高估了 DA – AC 不对称性。
- 贝叶斯理性中,学习分类前提是真的可以有两个推理角色。
- 条件化;
- 语用推论:被告知范畴前提为真通常暗示有条件前提的反例。if P then Q, 被告知Q为假,不会立刻得出P为假的推论。
条件化的rigidity condition, P~0~(q|p) = P~1~(q|p): 学习分类前提会改变一个人对条件前提的信念程度.
负面结论偏差。
当在条件语句中使用否定时,就会出现这种偏差,例如,如果一只鸟是天鹅,那么它就不是红色的。
否定范式,使用了四个这样的规则: If p then q; if p then not-q; if not-p then q; if not-p then not-q。最有力的发现是,当结论包含否定时,人们更认可 DA、AC 和 MT.
为了解释负面结论偏差,提出大多数类别仅适用于少数对象的想法(Oaksford & Stenning 1992)。
因此,一个物体成为红色的概率低于它不是红色的概率,即 P~0~(Red) , P~0~(¬Red)。因此,当 p 或 q 被否定时,边缘概率(P~0~(p) 和 P~0~(q))将具有更高的值。结论的先验概率值越高,意味着 DA、AC 和 MT 的相关条件概率值越高,即结论的后验概率值越高。因此,例如,如果一只鸟是天鹅,那么它是白色的,DA 推理结论的先验概率(P~0~(¬White))很高。所以条件概率P~0~(¬White|¬Swan)也很高,结论的概率(P~1~(¬White))也是如此。
因此,一个明显不合理的否定结论偏差可以被看作是一种合理的“高概率结论”效应(“high probability conclusion” effect)。
像任何理性分析一样,这种解释避免了对条件推理中涉及的特定心理表征或算法进行理论化。
6.经济化的证据:收集数据和检验假设 ¶
Wason’s selection task.
他们被问到应该翻出哪些牌,以检验如果牌一面是 A (p),那么另一面是 2 (q) 的假设。四张牌的上面分别为 A (p)、K (¬p)、2 (q) 和 7 (¬q)。
从逻辑上讲,根据观察到的证据,人们永远无法确定一个科学假设是正确的,因为人们发现的下一个证据可能是一个反例。所以,仅仅因为到目前为止你观察到的所有天鹅都是白色的,并不能保证下一只不会是黑色的。
相反,波普尔认为,假设检验的唯一合乎逻辑的策略是寻找可证伪的案例。在测试条件规则 if p then q 时,这意味着寻找 p, ¬q 的情况。这意味着,在标准选择任务中,应该选择 A (p) 和 7 (¬q) 卡片,因为这些卡片是唯一可能证伪假设的卡片。
结果显示:逻辑预测,对于条件推理,与数据的差异很大。事实上,参与者似乎不是寻求伪证,而是选择确认条件(p和q)的情况。这被称为“确认偏差”。
选择任务的理论范围与前面描述的条件推理任务的范围平行。
- 心理逻辑理论假设人们试图进行条件推理,使用上面作为分类前提来推断隐藏的面是什么。再次,调用了双条件解释:如果 A 则 2 可能在语用上暗示如果 2 则 A。如果人们对两个条件都执行 MP 推理,这将产生一个确认响应模式。要推断应该转出 7 ,需要考虑隐藏面。如果人们考虑到隐藏面不是 A 的可能性,那么可以应用 MT 所需的复杂推理模式。
心理逻辑的一个问题是:选择任务的表现应该看起来像条件推理任务表现,其中选择 2 (q) 卡对应于 AC,选择 7 (¬q) 卡对应于 MT。然而,在条件推理中,MT 比 AC 更受认可,但在选择任务中,情况正好相反,即 q (AC) 比 ¬q (MT) 多被选择。
心理模型:如果人们做出类似的预测最初将条件表示为双条件,并且不要“充实”这种表示。
ODS
最优数据选择 (ODS) 模型 (Oaksford & Chater 1994; 1996; 2003b) 是源自贝叶斯统计中最优实验设计的规范性文献 (Lindley 1956) 的理性分析。依赖于根据条件概率来解释条件。
e.g,假设if swan (p) then white (p),被解释为声称鸟是白天鹅的概率 P(q|p) 很高,肯定高于成为白鸟的基本概率,P(q)。这个假设被称为依赖假设(H~D~)。
贝叶斯假设检验是比较性的,而不是仅仅专注于证伪。具体来说,在 ODS 模型中,假设人们将 H~D~ 与独立假设 (H~I~) 进行比较,在独立假设 (H~I~) 中,假设一只鸟是天鹅,它的概率与一只鸟是白色的基本概率相同,也就是说,P(q|p) = P(q)。假设,最初,人们最大程度地不确定哪个假设是正确的(P(H~D~) = P(H~I~) = 0.5),他们选择卡片的目标是尽可能减少这种不确定性,同时转动最少的卡片。
以显示 swan ( p) 的卡片为例。这张牌的另一面可能是白色(p, q)或另一种颜色(p, ¬q)。根据这两个假设,每个结果的概率将完全不同。
e.g,假设一只鸟是白天鹅的概率为 0.9 (P(q|p, H~D~) = 0.9)。在依赖假设中;一只鸟是天鹅的边缘概率是 0.2 (P(p) = 0.2);一只鸟是白色的边缘概率是 0.3 (P(q) = 0.3)。然后,根据依赖假设,在卡片的另一面找到白色 (q) 的概率是 0.9,而根据独立假设,它是 0.3(因为在这个模型中,前件和后件是独立的,只需要参考相关的边缘概率)。而且,根据依赖假设,在卡片的另一面找到除白色以外的颜色 (¬q) 的概率是 0.1,而根据独立假设,它是 0.7。
有了这些信息,现在可以计算一个人在转动天鹅卡以找到另一侧的白色 (P(H~D~|p, q)) 后对依赖假设的新不确定度。根据贝叶斯定理,这个概率是 0.75。因此,一个人对依赖模型的新置信度应该是 0.75,一个人对独立模型的置信度应该是 0.25。因此,降低了关于哪个假设为真的不确定性程度。更具体地说,ODS 模型基于信息增益,在标准通信理论中,信息以比特为单位测量。此处,初始不确定性为 1 位(因为 P(H~D~) = P(H~I~) = 0.5,相当于单次公平掷硬币的不确定性),在本例中,这减少到 0.81 位(因为现在P(H~D~) = 0.75 和 P(H~I~) = 0.25)。这是 0.19 位的信息增益。
然而,在Wason’s task中,参与者实际上并没有翻牌,因此他们无法知道在翻牌之前他们会获得多少信息。因此,他们必须根据预期的信息增益做出决定,同时考虑两种可能的结果(p, q 和 p, ¬q)。
ODS 模型假设人们选择每张卡片与其预期的信息增益成正比。
ODS 的另一个关键假设:出现在假设的前件和后件中的属性几乎总是罕见的,因此基本发生率很低。即 提供背景信息会使前件和后件的概率很低。
P(q|p, H~D~) 的值设置为 0.9,P(p) 和 P(q) 的最佳拟合值分别为 0.22 和 0.27,即非常接近前面示例中使用的值。
ODS 模型表明,选择任务的表现表现出理性假设检验行为,而不是非理性确认偏差。将稀有性发挥到极致提供了一种简单的直觉。
假设我们考虑(相当难以置信的)条件:如果一个人被吸血蝙蝠(p)咬伤,他们会长出尖牙(q)。显然,我们应该检查我们知道被咬过的人,看他们的牙齿是否是尖的(即转动p卡);而且,我们不能从我们认识的没有被咬过的人身上学到什么东西(即,不要转¬p 卡)。根据贝叶斯分析,如果我们看到有人长着尖牙,肯定值得查明他们是否被咬过——如果有,这会提高我们对条件的信念(这相当于转动 q 牌)。但是调查没有尖牙的人(即不要转动 ¬q 卡)以查看他们是否被咬似乎几乎没有成效。可以肯定的是,这样的人有可能被咬过,这会否定我们的假设,并导致最大的信息增益;但这几乎是无限小的概率。几乎可以肯定,我们会发现它们没有被咬过,什么也学不到。因此,在罕见的情况下,q 卡的预期信息量高于 ¬q 卡,与证伪主义者的观点大相径庭,但与经验数据一致。
这项任务的行为可能受到一种似乎完全非理性的策略的支配:匹配偏差。这种偏见与否定结论偏差出现在相同的背景下,即在 Evans (1972) 的否定范式中。*如果一面是 A,则另一面不是 2(如果 p 则¬q)。这个任务中的牌是用它们的逻辑状态来描述的,所以对于这个规则,2 是假后件(FC)牌,7 是真后件(TC)牌。对于这个否定的后件规则,参与者倾向于选择 A 牌(TA:真前件)和 2 牌(FC)。也就是说,参与者似乎做出了伪造的反应。但是,参与者可能完全忽略否定并匹配条件中命名的值,即 A 和 2。
否定的“对比集”说明表明,由于稀有假设——大多数类别适用于少数项目——否定类别是高概率类别。具有高概率的前因或后因会改变与卡片相关的预期信息增益。如果结果的概率很高,那么 ODS 模型预测人们应该做出虚假的 TA 和 FC 响应,因为它们与最高的信息增益相关。因此,匹配偏差是一种理性假设检验策略。
- 概率效应的实验证明:
概率效应首先使用 Wason 选择任务的简化数组版本(Oaksford et al. 1997)进行实验证明,其中参与者可以连续选择多达 15 个 q 和 15¬q 卡(没有朝上的 p 和 ¬p 卡可以被选择 )。
正如 ODS 模型所预测的,在 q 的概率很高(即违反稀有度)的情况下,参与者选择更多¬q 卡和更少 q 卡。其他实验也揭示了类似的概率效应(Green & Over 1997; 2000; Kirby 1994; Oaksford et al. 1999; Over & Jessop 1998)。
然而,也有一些未能产生概率效应(例如,Oberauer 等人,1999;2004)。可能由于弱概率操作或其他程序问题而产生的(Oaksford & Chater 2003b;Oaksford & Moussakowski 2004;Oaksford & Wakefield 2003)。
引入了自然抽样程序 (Gigerenzer & Hoffrage 1995) ,参与者在执行选择任务时对卡片类别的频率进行抽样 (Oaksford & Wakefield 2003)。使用此程序,发现使用与 Oberauer 等人相同的材料的概率效应,这些影响并不明显。
- 匹配偏差的实验证明:
Yama (2001) 设计了一个关键实验来对比匹配偏差和信息增益帐户。他使用的规则引入了高概率和低概率类别,与血型 (Rh–) 和 (Rh+) 相关。人们被告知,这些类别之一,Rh- 是罕见的。因此,根据 ODS 模型和规则 if p then ¬Rh+ 应该引导参与者选择稀有的 Rh– 卡。相反,根据匹配偏差,他们应该选择 Rh+ 卡。 Yama(2001)的数据与信息增益模型基本一致。此外,通过对这些材料使用自然采样程序,这一发现得到了有力的证实(Oaksford & Moussakowski 2004)。
- 道义任务
在不同的方向上——这种道义选择任务(即,关于规范,而不是事实)需要不同的理性分析。在道义选择任务中,参与者被给予描述关于人们应该如何表现的规则的条件。
采用了决策理论方法(Oaksford & Chater 1994;Perham & Oaksford 2005)。
违规者是未接种疫苗 (¬q) 进入该国 (p) 的人。因此,假设负责检测违规者的参与者对检测这些案例具有很高的效用,即 U( p, ¬q) 很高。但是,所有其他情况都代表成本,因为这意味着浪费精力。认为人们计算与每张卡相关的预期效用。因此,例如,以某人没有接种疫苗的情况(¬q)为例。她可能进入该国(p,¬q)或不进入该国(¬p,¬q)。就像计算预期信息增益一样,计算预期效用 (EU(x)) 时必须考虑两种可能的结果:EU(:q) = P(p|¬q)U(p, ¬q) + P(¬p|¬q)U(¬p, ¬q)。
认为人们在道义选择任务中选择卡片以最大化预期效用。
- 包含情感内容的规则
如果你清理血液,则必须戴手套。以检测违规者为目标,你将查看不清理血液但戴着手套的人(¬p,q)。为了检测可能受到伤害的人,你需要检查正在清理血液但没有戴手套的人 (p, ¬q)。 Perham 和 Oaksford (2005) 建立了违规检测应该占主导地位的环境,但检测可能受到伤害的人的目标可能仍在发挥作用。也就是说, U(¬p, q) > U(p, ¬q) > 0. 威胁词“血”可以出现在 p, q 情况或 p, ¬q 情况中。在计算广义预期效用时(Zeelenberg et al. 2000),如果预期世界的结果状态是威胁的,则从检测行为的预期效用中减去遗憾项(Re)。例如,通过检查未戴手套的人 (¬q),看看他们是否有受到伤害的风险,必须预见到会遇到血液 (p)。因为“血”是一个威胁词,参与者翻一张¬q牌的效用降低了;也就是说,遇到 p, ¬q 卡片的效用现在是 U(p, ¬q) – Re,遗憾是 Re。因此,对于血液规则,“不戴手套”卡 (¬q) 的选择应该低于不包含威胁先行词的规则,例如,如果你清理包装,那么你必须戴手套。
在两个实验中,Perham 和 Oaksford (2005) 观察到了这种效应。当参与者的主要目标是检测违规者时,他们的¬p 和 q 卡片选择水平对于威胁(血液规则)与无威胁规则相同。然而,他们的 p 和 ¬q 卡片选择水平显着低于威胁规则比非威胁规则低。这一发现很与替代理论背道而驰,特别是进化论(Cosmides 1989; Cosmides & Tooby 2000),它做出相反的预测,即 p 和 ¬q 卡片选择应该增加威胁规则。
7.一个不确定的量:人们如何用三段论推理 ¶
8.结论 ¶
2.问题 ¶
概率、信念度、和条件句推理。
对p、q的判断:信息来源是否可靠,决定先验概率的大小。肯定前件等推理方式提供后验概率,会更新对后件的信念。
使用EEG,更新信念度的过程对比。