干扰背景下视觉目标探测依赖于对视觉目标和背景的神经编码



文献:Luo, C., & Ding, N. (2020). Visual target detection in a distracting background relies on neural encoding of both visual targets and background. Neuroimage, 216, 116870. https://doi.org/10.1016/j.neuroimage.2020.116870

论文原文

1. 研究背景

自然状态下的视觉环境是动态及复杂的,包含了大量的信息。对自然视觉环境的有效加工需要选择性注意,选择性注意受到自上而下的目标因素和自下而上的刺激因素的调节(Desimone & Duncan, 1995; Egeth & Yantis,1997; Yantis, 2000)。一方面,注意力可以主动调控到某个空间位置或某个视觉特征来加快行为发应。另一方面,注意力不可避免的受到与任务无关的干扰,这也是一种面对意外危险时的重要保护机制。

总的来说,自上而下和自下而上的注意调节根据干扰突出程度和目标相关性共同产生对外部视觉的偏见表征。例如,在视觉搜索任务中,突出与任务无关的刺激会影响眼球运动以及延长视觉搜索。同样,神经对于与目标刺激有相似特征的刺激的反应也会增强(Andersen et al., 2011; Painter et al., 2014; Serences et al.,2005)。最近的证据也表明,注意力会自发地在注意和未注意的视觉对象之间转换,与目标无关的刺激并不能一直能受到注意。对任务无关刺激的敏感性也因人而异,其潜在的神经机制尚不清楚。

2.本研究

本研究探讨在背景中播放使人分心的视频是如何干扰视觉监测任务的,并探讨个体视觉监测任务的表现与神经的相关性。背景为模拟日常生活中常见视觉干扰的卡通视频。并采用了一种新的刺激标记技术( stimulus tagging technique)提取对自然视频的神经反应,该技术建立在稳态视觉诱发电位(SSVEP) (Regan,1966)和时间反应函数(TRF)(Lalor et al., 2006)的基础上。

为了控制自下而上背景的突出程度,以空白背景作卡通背景的对照。为了控制自上而下的注意力,以目标监测任务和同时进行卡通视频观看任务作为对比。视觉目标的监测基于颜色和空间位置两个维度,因此任务同时涉及空间和目标特征的注意。在实验过程中采用脑电(EEG)记录,通过刺激标记技术,记录对视觉背景的神经反应,同时记录对视觉目标和其他干扰物的ERP,这样能够分析每个反应如何受到自上而下和自下而上因素的调节,以及哪个反应可以更好地解释个体行为表现。

3. 研究方法

3.1 参与者

50名成人,20-26岁,19名女性。矫正后视力都正常,无神经精神病史。一名参与者数据因EEG噪音过大被排除在外。

3.2 视觉刺激

背景

下图1A中的红虚线部分表示中心区域,黑色阴影线表示外缘区域,它们由灰色环形分割开,中间有一个绿色的+。视觉呈现的整个区域为静态的灰色屏幕或灰色卡通视频(“ Tom and Jerry” 中的片段,60Hz),两种背景的平均灰度相同。实验运用刺激标记技术来分别表征背景的中心和边缘部分。

图1

上图1C为反应标记范式,分别标记中心和外缘的背景区域。为了标记神经反应,用二进制信号调制背景的亮度。当调制信号为1时,背景变成黑色(RGB: 0,0,0),当调制信号为0时,背景不变。背景神经编码的特征是对黑帧的反应。中央背景每60帧会有随机不相邻的10帧被调成黑色。外缘背景以同样规则设置,但是中心背景与外缘背景不能同时变成黑色。由于背景调制降低了中心和外缘区域的亮度,所以将没有闪烁的环形区域的灰度值调整为原来的5/6,以使与中心和外缘区域有相似的亮度。

目标与障碍物

在背景之上会呈现彩色的环,最多可同时显示3个环,中心最多1个,2个在外缘。彩色的环会随机出现在中心区域和外缘区域的任意位置上,其出现的时间间隔为500ms ~ 1000ms之间。黄环出现概率为30%,紫环出现的概率为70%。黄环不会连续出现,只有中心区域的黄环才是要监测的目标,其他环为干扰物。

3.3 实验流程

实验分为三种情况,第一种情况就是参与者在空白背景下进行目标监测,称为空白监测。第二种是在卡通背景下进行目标监测,称为卡通监测。第三种是参与者在卡通背景下同时执行目标监测与观看卡通视频的任务,称为卡通双重任务。三种情况下刺激时间都为12min。每种实验条件下的监测目标都共出现288次。

参与者在实验开始时要盯着中心的绿色+,目标监测任务要求参与者当监测到中心区域的目标物(黄色环)时尽快按下按钮。在执行卡通双重任务时,要求参与者在执行目标监测的同时也要观看卡通视频,并在结束之后回答12个关于卡通视频的问题。在卡通监测条件下,结束之后也会问参与者12个关于卡通视频的问题,但是参与者在完成实验之前不知道会被问这些问题。在实验开始之前会通知他们将执行哪种任务,在空白监测与卡通检测中会根据参与者目标监测的准确率获得奖励。但是在卡通双重任务中会根据参与者目标监测和回答问题的平均准确率获得奖励。

4. 结果

4.1 行为结果

目标监测的反应时间和准确度以及卡通问题的准确率如下图2所示。灰色的点表示个体实际结果,黑色的线表示平均值,黑色的星点表示P值,一星代表P < 0.05, 二星代表P <0.01,三星代表P < 0.001 。图2A表示不同条件下的反应时间,可以看出在卡通监测和卡通双重任务时的反应时间明显延长;图2B表示不同条件下的目标监测准确度,可以看出在卡通双重任务时目标监测准确度显著降低;图2C表示卡通监测和卡通双重任务时的卡通问题回答正确率,可以看出当注意力部分分给观看卡通视频时的正确率显著提高。

图2

当目标监测时的背景为卡通视频时,任务的反应时间显著延长,准确度显著降低。表明自然卡通背景影响了视觉目标监测。并且卡通监测条件下关于卡通视频问题的平均正确率为46.5%,这也表明了在卡通背景下执行目标监测任务时,参与者会不由自主的被卡通背景分散注意力。

当执行卡通双重任务时,目标监测反应时间显著延长,正确率显著降低。回答卡通问题的正确率显著提高。表明同时进行其他任务会分散注意力。因此,不论是通过背景的突出程度来自下而上的调节,还是通过同时进行双重任务自上而下的调节都会影响注意力。

4.2 EEG对彩环的反应

图3A - D显示了对彩色环的大平均ERP。在每一种情况下,由中心区域黄环诱发的ERP,都有明显的P300成分,中心电极中P300成分最强。P300的潜伏期在不同的条件下没有区别,但是卡通视频和双重任务都降低了P300成分的振幅(图3A)。并且,在较早约280 ms的时间窗内,不同视觉背景条件下的ERP存在显著差异(图3A绿色和蓝色曲线)。当背景是空白屏幕时,与目标相同颜色的外缘干扰物会引起负性的ERP反应(图3C绿线),当播放卡通视频时,这种负性的振幅就减小了。

图3

4.3 EEG对背景的反应

神经对外缘和中央的黑帧反应如下图3EF所示,枕叶电极的反应最强。中央背景不同条件下的ERP峰值潜伏期在180-400ms之间(图3E)。外缘背景的空白监测与卡通监测的ERP差异显著(图3F),卡通监测与卡通双重任务的ERP差异不明显。

4.3 用EEG反应预测个体的行为表现

使用线性回归分析表征个体行为表现的神经相关性。采用线性回归方法预测不同脑电反应的个体反应时间和监测准确度。预测准确度(例如预测行为结果与实际行为结果之间的Pearson相关性)如图4所示。A:根据对不同刺激特征的ERP反应,预测个体的反应时间(上)和检测精度(下)。监测目标诱发的ERP具有显著的P300成分,在三种情况下均能预测个体反应时间和检测准确度;当背景为卡通视频时,外缘背景诱发的ERP也能预测个体的反应时间和检测准确度。

图4

散点图显示了参与者的预测表现和行为表现之间的相关性:(B)反应时间,(C)检测准确度。每个点代表一个参与者的数据。

研究进一步测试了是否可以通过单一条件下的神经反应来预测不同条件下的行为差异。如图4D:基于目标诱发的ERP(绿色实心条)与背景诱发ERP(红色实心条)预测不同条件下个体反应时间差异和检测准确度差异。结果表明,外缘背景诱发的ERP能够预测背景对检测准确度的影响,即空白检测情况与卡通检测情况之间的监测准确度的差异。监测目标诱发的ERP可以预测背景对反应时间的影响,任务对行为反应时间和检测准确度的影响。

4.4 在不同的时间窗内预测个体的行为表现

之前的回归分析将ERP整合在一个0-650 ms的时间窗内,为了确定哪些时刻包含了更多的行为信息,本研究将回归信息限制在较窄的时间窗内,如下图5所示。在这个分析中,在每个窄的时间窗口中选择了3个振幅最高的电极,如图5AC所示。枕部电极对目标的早期ERP反应最强(200 ms),而中后电极的晚期神经反应最强(~300– 650 ms) (图5A)。枕部电极对外缘背景的ERP反应最强(300 ms)(图5C)。

图5

对目标的早期反应(~150 ~ 200ms)可以预测在动画视频播放的条件下个体的反应时间。对目标的晚期反应(~300 - 500 ms)可以显著预测所有条件下的个体反应时间和检测准度(图5B)。对背景动画视频的早期反应(100 ~ 300ms)可以预测卡通监测条件下个体的反应时间和检测准确度。

4.5 表现好和不好的参与者的ERP

为了研究视觉目标诱发的ERP和背景诱发的ERP与个体行为表现的关系,分别对表现好和表现不好的被试的脑电图反应取平均值(每组10人),并分析波形的不同。根据参与者的反应时间或检测准确度分为两组。反应时间长和反应时间段的两组之间由目标诱发的ERP在早期(200 ~ 300ms)和晚期(300 ~ 650ms)时间窗上存在差异(图6A)。在三种情况下,各组之间由目标诱发的P300潜伏期都不同。卡通背景下外缘背景诱发的ERP差异在~100 - 250 ms之间(图6B)。以监测准确率高低划分的两组中,目标诱发ERP的显著性差异仅出现在晚期的时间窗口,在300 ~ 650 ms之间,卡通背景下外缘背景诱发的ERP差异在250 ~ 300 ms之间。

图6

4.5 脑电图反应捕捉了不同的神经加工过程

目标刺激诱发的ERP和外缘环境诱发的ERP都可以预测个体的行为表现,这两种反应具有不同的波形和不同的时空分布。为了进一步研究它们是否捕捉到了不同的神经过程,将两种反应结合起来预测个体反应时间和监测精度。如下图所示

图7

当两种ERP反应结合时,对卡通监测和卡通双重任务中个体反应时间的预测精确度显著提高;对卡通双重任务中监测准确度的预测精确度显著提高,而对卡通监测任务中的监测准确度的预测精确度有略微提高。

5. 讨论

研究结果显示在卡通背景下即使要求参与者忽略背景,依然会延长参与者监测任务的反应时间以及降低监测的准确度。当同时执行两项任务时,参与者的反应时间会进一步延长,准确度也会明显降低。在神经反应方面,ERP对视觉目标的反应,在中央电极最强,受到视觉背景和双重任务的调节;相反,ERP对外缘背景的反应在枕叶电极最强,对双重任务基本不敏感,但受到卡通背景的影响。

在卡通背景下,对监测目标和背景的反应都能预测个体的反应。并且者两种预测方法的结合能跟准确的预测个体在任务中的表现,表明了这两种反应代表了不同的加工过程。这些结果也表明了监测目标和背景的神经加工过程共同影响了个体在视觉监测中的表现。

5.1 P300和目标的后期处理

视觉目标的神经处理涉及广泛的皮层网络,而P300是视觉目标后期处理的经典神经标记。此研究发现视觉监测任务表现好的参与者的P300有更大的振幅和更短的潜伏期。

5.2 注意力和早期视觉加工

先前的研究表明通过注意力促进视觉皮层的早期感觉处理来增加神经反应从而改善行为表现。与以往研究一致,本研究发现在300 ms之前的较早时间窗内,视觉背景对视觉目标的ERP有显著影响。证明了早期突出的视频背景也可以调节早期视觉处理的神经反应。

5.3 自上而下与自下而上注意的影响

先前的研究已经证明,自上而下的基于特征或空间注意都能增强视觉处理,在此研究中监测目标位中心的黄色环既需要基于特征的注意也需要基于空间的注意。只基于特征的注意可能会增强所有黄环的注意。与假设一致,当背景为灰色的时候在外缘区域的黄环激起的ERP确实比外缘区域的紫环激起的ERP的振幅更大。然而,当背景为卡通视频时则没有以上不同。

而只基于空间的注意力可能会增强中央区域呈现的所有颜色的环。与假设一致,在中央区域的黄环与紫环相比呈现出更大的P300成分。并且中央区域的干扰物和中央区域的背景所引起的ERP都不能预测个体的行为。因此本研究结果显示了一个复杂的注意调节模式而不是简单的基于特征和空间的调节机制,尤其在有突出背景干扰的情况下。

如果自上而下的注意力选择性地增强了视觉目标的神经处理,而不对其他有同样空间或颜色特征的视觉对象处理,那么外缘背景的ERP为何能够预测行为?卡通背景很可能通过自下而上的机制干扰行为。即使参与者几乎没有注意到背景中的卡通人物,也能很好地识别出来,这很可能是外缘知觉刺激占主导吸引了自下而上的注意。因此,大脑是否能主动抑制外缘突出背景与任务表现有关。但是,视觉干扰物并不一直能调节行为表现,尤其是在一些视觉工作记忆(VWM)任务中。之前已经有提出注意的负荷理论和认知控制以解释不一致的分心影响因素(Lavie et al., 2004)。这个理论表明感知任务的难度决定了参与者被干扰物分心的容易程度。本研究中,容易的视觉监测任务更容易被干扰物分心。

有人提出,P300(又叫cento-parietal positivity (CPP))是知觉决策的一个指标,即感觉信息向知觉信息的神经转换。最近的研究表明,与早期的视觉反应相比,P300/CPP与知觉决策的关系更密切,能更好地解释行为 (Itthipuripat et al., 2015; Itthipuripat et al., 2014; Kelly & O’ Connell, 2013; O’ connell et al., 2012; Twomey et al., 2015)。但是,最近的研究表明对视觉目标的神经反应与背景的神经反应的整合能更好的预测个体的行为表现。

综上所述,本研究从行为学和神经学上表明,中心区域的视觉加工可能受到周边自然视频的影响,并证明了自上而下的特征注意、自上而下的空间注意与自下而上的注意之间的复杂交互作用。