文献: Wang, M., Over, D., & Liang, L. (2022). What is required for the truth of a general conditional?. Quarterly Journal of Experimental Psychology, 1-13. https://doi.org/10.1177/17470218221089331
1.文章背景 ¶
条件句在自然语言中有很多用法,本文关注的是对对象集合进行断言。
已有研究发现人们判断这些条件句之一的概率是 “ q given p ” 的条件概率P(q|p)。
1.概念 ¶
本文关注基本条件句(basic conditionals),如:
(2) If a card is round, then it is red.
“基本”指的是其解释仅基于其语义内容及问题中所给出的频率信息。不需要任何背景知识,前、后句之间的关系。
有和一般条件句(2)不同的一种条件句,单数条件句(singular conditional):
(3) If the card is round then it is red.
一般条件句是使用不定描述“a card”, 而不是指定描述“the card”的基本条件句。
对一般条件句的研究,如果使用指定描述是不恰当的。比如Wason选择任务(Wason’s selection task),没有给出从…中选择的信息,如果使用指定描述是不恰当的。
2.目的 ¶
实验中探究一般条件句是否是这些对象集合的“真”、“假”或“非真非假”,以及关于它们的模态问题,可能性和不可能性。结果将对条件句的主要解释产生重大影响。
3.已有解释 ¶
实质条件句解释(MCI):认为自然语言条件句是实质条件句(material conditional),if p then q 的真假取决于 p 和 q 的真假。但是会产生悖论,已经被rejected。
假设理论(ST): P(if p then q)=P(q|p)。可以区分不同真假的使用。
真值条件推理(TCI):if p then q 当且仅当在 p 和 q 之间存在演绎的,或足够强的归纳(或统计)或溯因推理的联系时才为真。仅 pq为真时, if p then q 不一定为真, p 和 q 之间必须存在联系。
MMT1
MMT2
2.实验 ¶
1.实验1:基于集合的真假判断 ¶
1.1 被试: ¶
120名大学生。
1.2 材料: ¶
问卷,判断给定集合中的一般条件句是“真”、“假”、“既不真也不假”。都是汉语句子。
为了确定一般条件的真实性在定性上需要哪些可能性,有必要控制不同情况下频率差异的可能影响。通过在实验 1 中将每种类型的数量设置为 10,将不同的情况保持在一个等概率的集合中:10 pq ,10 p¬q,等等。
1.3 目的: ¶
对于真假的判断是基于哪种解释。
1.4 结果 ¶
实验 1,五个解释对表 2 中的集合 C1 到 C7 的真值判断做出了不同的预测,不包含 p¬q 。将这七个子集称为关键集合。
仅包含 ¬pq 或 ¬p¬q 情况的三个关键集,被试表现出类似的响应模式。在每个关键集中,大约 50% 的被试判断条件句为假,大约 40% 的被试判断条件句既非真也不假,因此在这些集中,被试表现出个体差异。 “错误”判断是模态反应。
在没有 pq 的关键集中,超过 80% 的被试的判断是“不正确的”,即“错误”或“非真非假”。在这些没有 p¬q 情况的关键情况下,P(q|p) 不能在材料中定义。这表明在目前的材料中判断条件为真需要 pq 可能性。对于七个关键集,主要响应模式证实了假设方法的预测,而不是 MMT1 和 MMT2 的预测:当且仅当 P(q|p) = 1.
- 分析:贝叶斯混合序数回归(Bayesian mixed ordinal regression):R brms package
集合是自变量,响应变量是序数。对条件句的信任从“假”到“都不是”再到“真”。“真”为 1,“假”为 0 ,“都不”为 1 和 0 之间的数字,1⁄2。
计算了所有感兴趣的比较的贝叶斯因子,并报告了原假设 $BF_{01}$ 或反对它的 $BF_{10}$ 的相关贝叶斯因子。优点:1. 一旦计算出后验分布,就可以进行尽可能多的假设检验,而无需对多个检验进行任何校正。2. 这些分析能够量化无效的证据。
将七个关键集合中的每一个与包含 p¬q 的相应集合进行比较,发现包含 pq 的每个关键集比包含 p¬q 的相应集合引发更高的真值判断。被试通常在任何包含 p¬q 的集合中判断条件句为假。
比较全集和其他6个集合,全集比不包含 pq 的每个关键集引发更高的真值判断,且全集与包含 pq 的其他三个关键集之间的真值判断没有差异。此外,有强有力的证据表明,在 ΔP=0 的 C2 组、ΔP=0.5 的 C1 组和 ΔP = 1 的 C3 组之间,真值判断没有差异(30 < $BF_{01}$ < 37)。这一发现与 TCI 预测的独特模式不一致。
总体而言,对于七个关键集,被试更频繁地接受包含 pq 的四个关键集中的条件句,而不是其他没有 pq 的关键集,并且大多数被试同样经常接受包含 pq 的四个关键集中的条件句。这一发现也否定了 TCI,证明了 p 和 q 之间的“足够强”的联系对于判断条件为“真”不是必需的。
总之,总体响应模式表明,人们在包含 pq 而不是 p¬q 的集合中判断一般条件句为“真”,并且真值判断取决于 P(q|p),与 ΔP 无关.这些发现有利于 ST 假设方法而不是其他解释。仅假设性说明暗示,当且仅当该集合具有 pq 且没有 p¬q 时,对于这些材料中的集合,一般条件句将被判断为“真”。
2.实验2: 基于集合判断可能性 ¶
2.1 被试 ¶
100名大学生
2.2 材料 ¶
问卷,判断对于列表 C1 到 C15 中的每个集合,它是否“可能”是那个未指定的集合,即目标集合。
和实验1不同,在实验 2 中,没有给出关于一组情况类型的频率信息,因此默认情况下这些是等概率的。
2.3 结果 ¶
对于仅包含 ¬pq 或 ¬p¬q 情况的三个关键集,即 C5 到 C7 ,大约一半的被试认为这三个集对于目标集是“可能的”。这一发现似乎支持 MMT1。然而,另一半的被试并不认为这些集合对于目标集合是“可能的”,这一发现与 MMT1 相悖。对于剩下的 12 个集合中的每一个,大多数被试判断包含 pq 的关键集合“可能”是目标集合,而包含 p-q 的集合不是。对于七个键集,总体响应模式有利于 ST 而不是 MMT1 和 MMT2。
- 分析:贝叶斯混合逻辑回归(Bayesian mixed logistic regression)
集合是自变量。对于先验,使用标准的弱信息标度 t 分布,t(df=7, M=0, SD=2.5)(R 的 rstanarm 包)。
首先将七个关键集合中的每一个与包含 p¬q 的相应集合进行比较,例如,仅包含 pq 的集合 C4 与仅包含 pq 和 p¬q 的集合 C11。对于所有七次比较,有决定性的证据表明,每个关键集比包含 p¬q 的相应集更有可能成为目标集。这一结果表明,被试通常将包含 p¬q 的集合判断为“不可能”是目标集合。
将全集 C1 与其余六个关键集合 C2 到 C7 中的每一个进行比较。发现,不包含 pq 的三个关键集,即集合 C5 到 C7,收到的“可能”判断少于包含 pq 的全集。并且没有证据表明完整的关键集与包含 C2 到 C4 pq 的其他关键集之间的可能性判断不同。与集合 C1 和 C3 不同,在集合 C2 中 p 和 q 之间没有强联系,其中 q 独立于 p。然而,大多数被试仍然认为目标集 C2 集是可能的。这一发现与 TCI 的独特预测不一致。对于这七个关键集,大多数被试同样经常将包含 pq 的四个关键集视为“可能”,并且比其他没有 pq 的关键集更经常将这四个关键集视为“可能”。因此,条件的真值并不意味着 p 和 q 之间存在“足够强”的联系。这一发现与 TCI 相反。
总之,总体响应模式表明,“真”条件句可以指代包含 pq 但没有 p¬q 的集合。对于一个真一般条件句,集合需要包含 pq 。全集,包含 pq, ¬pq, ¬p¬q, 不需要。和MMT2相反。因此,这些发现有利于 MMT1/MCI 和 MMT2 的假设解释。当且仅当该集合具有 pq 且没有 p¬q 时,真正的一般条件才有可能在本文的实验材料中引用一个集合。
本文研究了将一般基本条件断言为“真”与 pq、p¬q ¬pq 或 ¬p¬q 可能性之间的定性联系。总体结果证实,要判断一般基本条件为“真”,pq 情况必须是可能的,并且是唯一需要可能的情况。这些基本条件不等同于显式的可能性模态连接,如 MMT2 中那样。并且它们不需要其前件和后件之间的推理关系,如 TCI 中那样。基于条件概率假设和 Jeffrey 表的假设理论 ST 对本实验结果给出了最好的解释,从而为这些理论提供了新的支持。
3.问题 ¶
一个 vs 这个,汉语语境下的差别
R brms package