在线指称分辨中立即使用共同基础信息的ERP证据



文献:Sikos, L., Tomlinson, S. B., Heins, C., & Grodner, D. J. (2019). What do you know? ERP evidence for immediate use of common ground during online reference resolution. Cognition, 182, 275–285. https://doi.org/10.1016/j.cognition.2018.10.013

原文

1.文章概述 ¶

目前关于观点采择的研究大多是视觉情境范式的眼动研究,对眼动和行为进行分析,不清楚在线加工的时间进程。

  1. 以自我为中心假说的2个变体
  • 观点调整 Perspective-Adjustment:调整需要抑制以自我为中心的信息,成本高且耗时,且无法解释相比特有信息对共有信息的偏见。

  • 预期整合

感知者可以在听到参考表达(预期阶段)之前,战略性地使⽤共有信息对潜在指称进⾏⾃上⽽下的预测。但是,在处理指称表征(集成阶段)时,完全忽略了共有信息。认为对共有信息的偏见是预期加工的产物。

  1. 基于约束假说

多个概率约束相互作⽤以指导指称分辨,每个概率都可以发挥其影响⼒,因为它变得可⽤。

听者不是天⽣以⾃我为中⼼,⽽是根据各种因素(如对话交流的性质、交流的⽬标、可⽤的线索类型)不断权衡社会线索(例如,基础信息)和⾮社会线索(如感知信息)。因此,基础信息原则上⼀ 旦可⽤,就可以进⾏整合。但是,由于感知信息也被考虑在内,任何在特有信息与⽬标共享感性特征的对象都应导致⼀定数量的内在性。这⼀假设的⼀个关键预测是,来⾃⼲扰项的⼲扰量应由基础信息调节,这样特权⼲扰的相互间性将低于共享⼲扰。此原因还能够解释以前⼯作中的许多相互⽭盾的词。系统⽴即使⽤基础信息的能⼒与显示早期观点采择的结果相容,和来⾃每个感知相似的对象的⼲扰解释了为什么眼睛被吸引到处于特权地位的⼲扰项。

已有眼动视觉情景研究的关键假设是眼动指示了潜在指称。但是眼动可能受其他因素影响。比如注意力分散。

我们不能确定为什么被试选择⽬标的速度较慢,并且更有可能在特有对象成为干扰项时注视特有对象。理解系统可能真正将⼲扰项视为候选,也可能是⼲扰项只是从⽬标中引起注意。眼动追踪和其他⾏为措施⽆法区分这些相互竞争的解释。

指称歧义和明确控制的单词的神经生理反应不同。

1a. There was a boy upstairs and a boy downstairs.The boy…

1b. There was a boy upstairs and a girl downstairs.The boy…

这种⼤脑对指称歧义(Nref 效应)的反应的ERP 信号通常出现在模棱两可的单词开始后的 300/400 ms,并且分布⼴泛,但额叶区域占主导地位。这种效果在书⾯和⼝语刺激中,以及在⼆分法描述形式(代词和完整名词短语)中是强⼤的。重要的是,它是由可⾏的指称候选之间的竞争可靠地引起的。

必须是有竞争,才会出现Nref效应。这种负波是极其持久的 - 它持续1000⾄2000ms,甚⾄已被证明持续超过,触发歧义已经解决900ms后。因此,Nref efect 可以⽤作暂时的指称歧义的诊断。

  • 目的:利⽤指称歧义的话语引发的神经反应来评估观点采择的时间过程。

  • 假设:

目标物始终是共有信息,干扰项可能是特有信息干扰(PGC)、共有信息干扰(CGC)或没有干扰项(NoC)

图1

  1. 如果存在指称歧义敏感,相比NoC条件,CGC应该引发更可靠的Nref效应。

  2. 关键在于PGC是否有Nref效应

  • 如有,说明被试将特有信息作为候选,支持以自我为中心的假说。

  • 如没有,说明不是以自我为中心,而是快速使用基础信息将候选限制在共同信息。

  1. 关键的时间进程问题,何时可以利用基础信息来限制潜在的候选指称。
  • 以自我为中心(fig2B):最开始会认为2个“雷龙”都是潜在候选,因为基础信息的使用被推迟到第二阶段,因此应存在一个有意义的指称模糊期。

比如Barr(2008, 2016)认为PG干扰和CG目标有相同地位,但没有明确这种等效激活要持续多久。Kronmueller et al. (2017)认为基础信息在指称描述后1000ms左右使用。Barr (2016)的眼动研究发现PG干扰似乎与CG⽬标竞争⾄少400⾄500 ms。这一阶段的歧义会引发强大、持久的Nref。

目前没有Nref效应小于950ms的例子,说明以自我为中心的假说预测PGC条件下可以观察到强健的Nref。

  • 基于约束(fig2C):一旦信息可用,可以马上使用基础信息来限制候选,在PGC条件下,听到目标词后立刻获取基础信息。这一假说预测立刻使用基础信息将有效防止指称歧义的产生,不会触发Nref。

图2

总之,如果 PCG 条件在ERP的任何时候引起 Nref效应,则表明被试最初认为PGC是指称候选,并且仅提供基础信息,以解决含糊不清的问题。相⽐之下,如果没有发现Nref效应,它将提供强有⼒的证据,证明基础信息⽴即被⽤来限制潜在指称只针对那些有共同信息的候选,基本上排除了由此产⽣的歧义。

最后,如果以前研究中报告的眼动和反应时间的⾏为模式与注意⼒分⼼感染混淆,那么本文也应该在当前任务中找到响应时间注意⼒分散的证据。如果特有信息干扰项将⾮指称的注意⼒从⽬标中移开,那么应该指出,听众在最终选择 PGC 条件下正确的⽬标对象时会延迟,⽽不应引起 Nref efect。

2.实验 ¶

50名右利手,英语母语。

被试⼀边听着预先录制的命令,⼀边观看图片展示,出现⼀个2x2⽹格,⾥⾯有四只戴着配饰的动物。每个trial,四个中有三个在⽩⾊背景前,表明主试可以看到它们。第四只动物在灰⾊格,表明它对主试隐瞒了。特有象限的位置和动物象限任务是随机的。视觉刺激结合了11种多⾳节动物和⼗个配饰。每个动物和每个配件的初始⾳素是不同的,因此歧义和区分歧义的区域将有明确的开始。

每个音频对应3种条件,120个刺激。还有额外的2个视觉控制条件,40个trials。这些条件在视觉上与 CGC 和 PGC 显示屏相同,但⽬标在共同点中是单⼀的。这些条件确保被试不能根据显示屏提前预测⽬标动物的身份。

每个条件的相同情况的试验不超过两次,连续试验不超过三次共享相同的动物⽬标,每个动物+配件⽬标在每个条件出现不超过⼀次。

音频是使用自然的语速和语调录制的。平均⽽⾔,⽬标名词在命令启动后开始为 2882 ms (SD = 200),平均持续时间为 652 ms (SD = 29)。区分性的配件开始 879 ms (SD = 112) 后。

被试完成一个调查问卷和2个练习环节。

  • 第一个练习:熟悉试验任务。

  • 第二个练习:为了减少眼电和肌电伪迹的影响。被试在实验中被要求在音频末尾听到第二个铃声之后再做出反应,在第二个铃声响起之前做反应,屏幕上提示“太快”。在第二个铃声响起之后做反应,出现“good trials”。被试连续出现10个“good trials”完成第二个练习。

正式实验:在ERP部分之后,被试被要求描述他们如何解释灰⾊ ⽅块,他们是否赞同主试的展示,以及他们是否制定了任何策略来做出⾃⼰的选择。

  • 记录:64通路,阻抗降到40 kΩ以下。

  • 离线分析:使用NetStation 4.5.4 (EGI), EEGLAB, ERPLAB。降采样到250Hz,带通滤波0.03–40 Hz,基于目标词的发音将EEG记录分为-200到1600 ms的分段。去除了± 75 μV的电位。将有伪迹的分段去除,平均段损失为8.5%;响应提示前作出反应的trial也去除,1.1%。每个条件中每个被试获得的单独的ERP波形使⽤200ms的预刺激间隔进⾏基线校正。

  • 数据分析:使用重复测量(repeated-measures)和双尾检验( two-tailed cluster-based permutation tests)。61个非眼电极的0-1600ms都包括在内。

使用混合效应线性回归。

  • 不同条件准确率基本相同,在各种条件下处于最⾼点。

  • 反应时:NoC最快,CGC最慢。NoC显著快于CGC和PGC,但是PGC不是显著快于CGC。

此模式复制了听众在最终选择正确的⽬标对象时,当有特有干扰时,被除名的常⻅标记。为了确定此延迟是否因为特有干扰被视为推荐候选竞争对⼿,还是由于注意⼒分散(即特有干扰将非指称注意⼒从⽬标中吸引)所致。

  • CGC vs NoC

CGC 从⼤约 600 到 1200 ms 中引起了⼴泛分布的负波,这在分段的剩余时间(1200 到 1600 ms)中更靠前.

图3

CGC和NoC相比,显示一个显著的负集中(negative cluster),持续595-1600ms,由多达55个电极组成。相比NoC,CGC出发一个可靠且广泛分布的负波。fig4,left

图4

  • CGC vs PGC

CGC-PGC的ERPs对比度和CGC-NoC的ERPs对比度相同。

CGC和PGC的比较,显示一个显著的负集中(negative cluster),持续605-1600ms,由多达51个电极组成。说明CGC比PGC的竞争显著更大,和以自我为中心的假说相反。fig4,right

  • PGC vs NoC

没有显著负集中。

PGC 和 NoC 之间没有发现任何差异,这与 CGC 和 NoC 之间明显⽽有⼒的差异形成鲜明对⽐。CGC和PGC在605ms分离,CGC和NoC在595ms分离,说明被试不认为PGC是和CGC等效的候选。

但是ERP研究需要比行为实验更多的试验量,被试是否会在实验过程中制定一种策略,简单地忽略PGC,因为灰色格始终不是目标项。

这种情况不太可能的原因:

  1. 如果被试学会忽略PGC,那么应该在 PGC 和 NoC 条件之间的平均响应时间中发现没有差异。相反,⾏为结果表明注意⼒分散 —— 在 PGC 试验中选择正确⽬标的速度⽐ Noc 试验慢 — — 表明注意⼒被PGC吸引,被试没有学会忽视特有信息。

  2. 对ERP数据的四分位分析显示,在实验的第⼀季度,CGC明显⽐NOC和PGC都更多负电位,在研究的剩余时间⾥,CGC在数量上仍为负波。在任何四分位数的ERP数据中都没有发现以⾃我为中⼼的证据,也没有随着实验的进展⽽发⽣质的变化。

图5

  • 反应时的四分位数分析:注意力分散随时间消散,可能是受被试对任务熟悉度的影响。

整个实验的数据和研究的异常四分位数的趋势都强烈地反对被试从战略上学会避免隐藏象限中的指称的观点。

3.讨论 ¶

⾏为结果复制了以前研究中发现的注意⼒分散效应。相对于NoC, 当显示屏包含PGC时, 部分被试的反应会变慢, 当不包含CGC时, 部分被试的反应在数字上甚⾄更慢。尽管有证据表明被试受到这两种类型的共有信息的影响,但ERP结果显示了⼀种显著的分化模式。与 NoC 和PGC 相⽐,CGC 条件引起强⼤的 Nref 效应。

这些影响出现在同⼀时间窗⼝,并具有类似的空间分布。此外,NOC 和 PGC 条件之间没有明显差异。这种模式表明,虽然共同点中的干扰项被视为候选指称,但PGC则不被视为。换⾔之,被试对说话者表达指称的期望很快受到基础信息的限制,从⽽排除了在PGC 条件下出现的指称歧义。

目前的结果最符合基于约束的假说。当⼀个特有干扰项与⽬标共享关键特征时,被试的⾏为反应会因注意⼒分散⽽减慢,但关键是,特有干扰并没有引起指称歧义的神经特征。因此,听者将信息状态编码为共有或特有,然后在在线指称分辨中使⽤这种区分对仅出现在共同点中的对象使用,来限制潜在指称。

虽然眼动明显受指称识别过程的驱动,但它们也受到其他注意机制的影响。本文结果已经证明,⾏为测量和神经⽣理测量可以同时显示分化模式。因此,有理由认为注意⼒分散会受到特有干扰与⽬标共享关键特征这⼀事实的驱动,从⽽在这个常⽤的范式中发挥重要作⽤。