物体间的拓扑关系是分类感知的



1.参考文献 ¶

Lovett, A., & Franconeri, S. L. (2017). Topological relations between objects are categorically coded. Psychological Science, 26(2017), 1-11. https://doi.org/10.1177/0956797617709814

论文原文

2.研究背景 ¶

当人们进行视觉解释时——例如,图形、物理图表——视觉比较起着核心作用。在每一种情况下,人们都会通过识别他们当前看见的与之前看见的结构之间的共性和差异来进行探索、理解和解释。例如,在细菌进入细胞的图中,您可以看到该过程作为一系列离散步骤展开(图1)。更好地理解人们如何进行这些类型的比较——可以存储和比较什么信息、以及多少信息——不仅可以帮助理解人类视觉系统如何编码和比较视觉结构,还可以帮助理解如何设计视觉描述以促进理解过程。

此项研究证明人们对关系结构进行分类编码。分类编码放弃了精度,转而采用更有效的关键的离散表征(Biederman,1987)。分类编码通常通过刺激变化在跨越类别边界时比不跨越类别边界时更容易检测来证明,即使两者变化量相等。例如在图1中,与右图相比,左图中前两个步骤更容易区分,因为在左图中,细菌已经越过了细胞的边界,这两个物体之间的关系发生了类别变化。

分类编码表现在感知和认知方面。例如,即使控制颜色空间中的距离,区分蓝色和绿色也比区分两种深浅不同的绿色更容易 (Bornstein & Korda, 1984)。面部表情 (Etcoff & Magee, 1992)、听觉音素 (MacKain, Best, & Strange, 1981)、几何形状 (Amir, Biederman, Herald, Shah, & Mintz, 2014) 和尺寸也有类似的效果 (Kosslyn, Murphy, Bemesderfer, & Feinstein, 1977)。此外,当对象的部分之间存在类别差异时,与没有类别差异时相比,更容易区分两个对象(Hummel & Stankiewicz, 1996; Rosielle & Cooper, 2001)。

具体来说,此项研究受行为研究(Huttenlocher,1991)和以前的计算模型的启发,这些模型提出了一个分类关系词汇表,可用于解决各种视觉比较问题。例如,这些模型基于计算空间推理(Klippel、Yang、Wallgrün、Dylla & Li.,2012;Randell、Cui & Cohn,1992)提出了三个拓扑关系(图2): 接触(边缘彼此接触)、重合(两个对象内的重合区域)和包含(一个对象包含在另一个对象中)。这些模型的表现模式反映了人类在多项任务中的表现。这表明模型中的关系和分类边界可能与人类的相似。

图1

在这里报告的实验中,测试人类是否对三种拓扑关系敏感。通过测量被试对跨越或未跨越分类边界变化的敏感性,来测试拓扑关系是否被分类编码。为此设计了一个序列变化,其中小圆相对于大圆的位置每一帧水平移动相同的距离(图3a)。在某些情况下,位置变化导致了类别关系的变化,而某些情况下没有。预测与未跨越类别边界相比,被试在跨越类别边界时更容易注意到变化。

在实验1a和1b中,改变了圆圈组合的数量(图 3c),以衡量被试依赖分类信息的程度是否根据他们必须跟踪的元素数量而变化。在实验2中,圆圈被填充,作为探索可能影响拓扑关系编码的视觉特征的第一步。

3.实验1a和1b ¶

图2

图3

使用了图3a中所示的八个圆形组合和七个间隔。其中四个间隔引入了类别变化(例如,从包含到触摸到包含的变化),三个是类别内变化(圆圈既接触又重叠)。为了使两者的数量相等,在实验设计中包括了八个区间,随机选择重复的接触+重叠或无关系区间作为第八个区间。每个试验使用图3a 中的圆圈组合或它们的镜面反射组合(即小圆在大圆的左侧)。为了减小一组中的两个圆圈在感知上被归为一个物体的可能性,大圆圈和小圆圈使用了不同的颜色,红色和绿色或蓝色和黄色,较小的圆圈总是画在更大的圆圈的前面。圆圈颜色在被试间进行了平衡。

屏幕上的箭头提示被试注意一个、两个或三个象限。 500毫秒后,每个提示象限中出现一对圆圈,并在2,500毫秒内保持可见。之后是1,000毫秒的延迟,包括250毫秒的掩蔽(其中每个大圆圈都被各种随机放置的小圆圈覆盖)和750毫秒的空白屏幕(只有箭头),圆圈对重新出现。被试的任务是报告第一种显示是否与第二种不同。如果所有圆圈相同,他们会按下计算机键盘上的一个键,如果他们注意到任何不同,则用另一只手按下另一个键(“Z”和“/”)。反应键的分配在被试间平衡。当被试反应错误时,屏幕上会出现“错误”字样2.2 秒。

一半的试验是不同的试验,其中一对发生了变化,另一半是相同的试验,没有变化。一半的不同试验涉及类别差异,而另一半涉及类别内差异。在不同的试验中,变化出现在屏幕的四个象限中的概率相同。

在这些实验中,使用一组和两组圆圈(实验1a)以及两组和三组圆圈(实验1b;图3c)测试了被试在检测类别变化方面是否比类别内变化更准确。每个实验共包含256次试验:2 种试验类型(相同/不同)×8种变化间隔×2种小圆圈位置变化方向×4个变化象限×2种集合大小。通过将两个反应键分配与圆圈的四种配色方案交叉,创建了八个被试间的条件。这些条件中的大多数在每个实验中都测试了两次。

15名西北大学学生(11名女学生,4名男学生)参加了这个实验。图4总结了被试的准确度。使用2(大小:一对与两对)×2(差异类型:分类与度量)重复测量方差分析 (ANOVA) 来分析不同试验的准确性。与两组圆圈试验 (M = .804) 相比,被试在一组的试验 (M = .914) 中表现更好,F(1, 11) = 31.6,p < .001,ηp2 = .758。在类别变化试验中的表现也更好 (M = .907) 与类别内变化试验 (M = .810) 相比,F(1, 11) =43.8,p < .001,ηp2 = .693。这种分类变化优势在两对试验中特别明显,这可以通过大小和差异类型之间的显着交互作用来证明,F(1, 11) = 17.7, p = .001, ηp2 = .559。因为这种交互作用可能是由一组条件下的接近天花板效应驱动的,所以在实验1b中,测试了比较两组和三组试验时是否会发现这种交互作用。

尽管任务说明中没有强调反应速度,但分析了正确反应的反应时。当只有一组圆圈时 (M = 976 ms),被试的反应比有两组圆圈时更快 (M = 1,294 ms) ,F(1, 11) = 155.9, p < .001, ηp2 = .918,类别差异(M = 1,105 ms)比类别内差异(M = 1,165 ms)的反应更快。大小和差异类型的交互作用不显着,p > .250。

e.实验1b结果 ¶

15名被试参与了该实验(11 名女性,4 名男性;平均年龄 = 22.6 岁)。图4为被试的准确度。使用 2(大小:两对、三对)×2(差异类型:分类对度量)重复测量方差分析对不同试验的准确度进行了分析。与三对圆圈试验 (M = .657) 相比,被试在两对的试验 (M = .773) 中的表现更准确,F(1, 11) = 32.7, p < .001, ηp2 = .700。与类别内变化试验 (M = .642) 相比,类别变化试验 (M = .789) 的表现也更准确,F(1, 11) = 35.2,p < .001,ηp2 = .715。分类变化优势再次在较大组合(三对)的试验中更大,鉴于大小和差异类型之间的显着交互作用,F(1, 11) = 5.4,p = .036, ηp2 = .278,尽管在这个实验中这个交互作用的影响大小要小得多。

分析了正确反应的反应时。当只有两个圆对 (M = 1,296 ms) 时,被试的反应比三个圆对 (M = 1,486 ms) 时更快,F(1, 11) = 18.9, p = .001, ηp2 = .574。差异类型的主效应 (p > .250) 和交互作用 (p > .250) 都不显着。

7.结论 ¶

未来的研究可能会结合语言干扰操作来研究某些关系(例如,“左”与“右”的区别,众所周知,它比其他关系发展得更慢;Rigal,1994)是否比其他关系更依赖于语言编码。