文献：Wang, F., Kaneshiro, B., Strauber, C. B., Hasak, L., Nguyen, Q. T. H., Yakovleva, A., … & McCandliss, B. D. (2021). Distinct neural sources underlying visual word form processing as revealed by steady state visual evoked potentials (SSVEP). Scientific reports, 11(1), 1-15. https://doi.org/10.1038/s41598-021-95627-x

论文原文 ¶

1. 背景 ¶

阅读是人类认知发展重要的一方面，对人日常生活非常重要，熟练地读者每分钟能读250个单词，如此高的阅读速度依赖于专门的视觉加工大脑资源的单词识别机制。之前的fMRI研究已经表明大脑左侧枕颞皮质腹侧(vOT)的一个区域相对于其他视觉刺激(如线条画和面孔)而言，对不同语言的印刷文字具有特别的选择性，并且对于字体、大小、大小写甚至视网膜位置都是不变的。大量的fMRI研究表明，vOT遵循从后到前的分级过程，后部区域对视觉单词形式处理更具选择性，而前部部分对高层次的单词特征权重更大。从后到前的梯度是通过从后枕骨到前颞区增加神经元感受野来实现的，结果，神经元的灵敏度从字母片段到单个字母、双字母组、三字母组、词素以及最终整个单词形式分级增加。最近的一项研究表明，除了vOT内的子区域之外，语言网络的其他区域(如角回)也通过传递和整合来自和朝向vOT的信息而参与单词的快速识别。这项研究进一步说明了vOT的后部区域在结构上主要通过自下而上的通路与顶内沟相连，而中部/前部区域很可能通过前馈和反馈连接与其他语言区域相连。

脑电具有高的时间分辨率，事件相关电位(ERP)研究已经表征了一个在150至200 ms之间达到峰值，具有枕颞负和额中央正的地形图，称为视觉词N170。这种N170成分对于单词和类单词刺激来说通常比视觉控制符号更大，这种成分也出现在儿童学习印刷语言的前两年中。

由于高信噪比，近来有很多研究使用稳态视觉诱发电位(the steady-state visual evoked potential, SSVEP)范式研究视觉单词辨别，与要求长刺激间隔的典型ERP方法相比，SSVEP范式以快周期速率呈现刺激(e.g., 10 Hz, 100 ms per item)，周期性刺激的呈现在预定的刺激频率及其谐波下引起周期性反应。这些周期性反应被称为SSVEPs，因为它们的幅度和相位随时间保持稳定。并且由于噪声频段宽度小，SSVEP模式可以在短短几分钟的刺激中提供高信噪比。SSVEP范式长期以来一直局限于低级视觉感知和注意领域。直到最近，这种范式才被扩展到更复杂的视觉刺激处理，如物体、面孔、数字、文本、字母和单词。这项研究试图使用这种范式来解决视觉单词识别的神经研究中的关键但尚未回答的问题：我们如何实时协调两种非常不同类型的神经计算，这两种计算涉及到单词的视觉形式与其词汇语义表征。如何用脑电图研究这些概念上不同但时间上重叠的处理水平？如何克服依赖于“纯插入”假设的方法的局限性，以从字母形式的识别和词汇语义访问的过程中“减去”视觉特征处理？在以前的工作中，包括使用fMRI、ERP和SSVEP的研究中，一种常用的方法是使用分级刺激对比，试图通过依赖“纯插入”的假设来分离这些处理水平。例如，最近的一项fMRI研究使用了“感知”对比(例如，单词-棋盘、单词-乱码)和“词汇”对比(例如，单词-伪单词)来分离与每个不同单词识别过程相关的大脑活动。但是fMRI在几秒钟内积累神经活动，无法捕捉快速时间尺度的神经动力学。提供更高时间分辨率的ERP和SSVEP研究也使用了类似的层次对比(词-假字体、词-非词和词-假词)。本研究想要探讨视觉单词识别过程中不同层次的处理是如何展开的。研究首先关注SSVEP范式中的词内假字体对比，然后使用数据驱动的分析方法来区分这种对比经常引起的两个过程——熟悉的字母和单词中字母组合的视觉形式分析，以及与熟悉的视觉单词的识别相关的词汇语义过程。然后，应用同样的技术来研究非单词中的单词和假单词中的单词的对比，看看是否可以在SSVEP数据中识别出相同的两组神经过程。

先前对高级过程的SSVEP研究使用了不同的呈现范式，包括适应和“周期性异常”方法。适应性方法已经被用于检验刺激呈现位置是否影响知觉，主要是通过比较具有相同或不同身份的直立或倒置面孔流来检验与面孔整体加工相关的知觉。相反，在“周期性异常”刺激模式中，一系列控制刺激以预定的周期速率被异常刺激所替代。异常刺激通常在特定方面不同于控制刺激。控制和异常刺激可以遵循“图像交替”模式，在该模式中，周期性基本速率中的每隔一个图像是异常的。例如，基数为6Hz，偏差刺激为3Hz。

本研究的第一个目标是确定RCA是否会揭示与单词识别相关的多个来源，即使这些来源可能具有重叠的时间进程和拓扑结构，这可能会导致基于传感器的研究假定单个活动来源反映了单词识别的单个过程。第二个目标是探索这种RCA识别的源是否特定于一组狭窄的呈现参数和频率，或者这种源是否可以在一系列实验参数中一致且稳定出现。

当前的研究通过在三种条件下呈现周期性分布在控制刺激(即假字)中的熟悉单词来解决这些问题，三种条件分别为:（1）基础刺激为10Hz假字，偏差刺激为2Hz的单词；(2)和条件（1）一样，但是刺激呈现的位置在屏幕中心抖动；（3）和条件（1）一样，但是基础刺激呈现频率为6Hz偏差刺激频率为3Hz。为了研究视觉单词识别的层次，还有两个额外的刺激对比：（4）偏差刺激词嵌入在非词中；（5）偏差刺激词嵌入在假词中。

假设当进行RCA时，假字中的单词变异体会引出一个以上的神经辨别源，产生至少两个具有不同时间和地形信息的可靠信号源。本研究试图进一步研究RCA成分拓扑和时间进程是否特定于特定的实验参数，或者类似的成分是否可以在更大范围的呈现率和刺激位置的变化中被引出。

2. 方法 ¶

2.1 被试 ¶

16名英语母语者，年龄18.1 到 54.9岁，7名男性，所有被试视力或矫正后视力正常，无阅读障碍。

2.2 刺激 ¶

共4种类型的刺激：words (W), pseudofonts (PF), nonwords (NW), pseudowords (PW)，所有真词、假词和非词的首字母和尾字母都是辅音。

2.3 实验流程 ¶

被试坐在昏暗的房间中，离电脑屏幕1m，先熟悉实验程序。在刺激序列开始之前是一个持续时间为2500ms到3500ms的空白屏幕。每个condition包括四个trial，每个trial持续12s，并重复四次，因此每个condition有16个trial，每个被试所有condition下总共80个trial。20个trial（5 conditions × 4 trials ）组成一个block，每个block中trial的顺序是随机的。为了维持被试的注意力，被试需要盯着持续出现的十字标志，并且这个标志叠加在兴趣刺激上，当检测到十字标志的颜色由蓝边红（每个trial中随机变化2次）的时候被试需要按键。颜色变化任务采用“阶梯”模式，在此期间，颜色变化闪烁的时间随着准确度的增加而变快，或者随着准确度的降低而变慢。整个实验每个参与者花费大约30分钟，包括block之间的休息。

3.结果 ¶

3.1 行为结果 ¶

不同条件下的准确度和反应时如下图所示，分离单向ANOV表明不同条件下的准确度和反应时没有显著差异，因此被试充分的投入到实验中。

3.2 基础刺激分析结果 ¶

基频谐波下的反应进行了RCA结果总结在图2中，图A显示了每个条件下最大相关分量(RC1)的空间滤波器的地形，所有的地形图都显示了枕叶内侧区域的最大权重；条件1、2、4和5的成分之间的相关性很高( r ≥ 0.84 )，条件3的相关性较低，但仍然很高。图B中的图以柱状图呈现了投影的幅度。

3.3 偏差刺激分析结果 ¶

分析偏差刺激以研究视觉单词辨别机制和区域，鉴于越来越多的证据支持vOT内的分离以及文本和字母识别不同源的发现，假设在单词相关的处理过程中应该捕获多个源(假字中的词)，由于先前观察到对vOT内视觉上与语言上相关的子区域的反应存在明显的从后到前的梯度，因此研究假设不同条件下会引起不同的地形反应和相位。对于word-in-pseudofont, condition 1，如图3A所示，第一成分(RC1)的形貌在左后vOT区域最大（这与fMRI研究表明的左侧 vOT在视觉单词识别中具有重要作用的结果一致，并且在Barzegaran et al.的研究中同样使用RCA在观看包含多组完整和杂乱字母的图像时也能看到这个成分，进一步支持了在提取与单词形式中的字母相关联的习得的视觉特征信息中涉及该第一成分的看法），而第二成分(RC2)更多分布在的顶骨背侧区域。在RC1的复数值数据的前三个谐波和RC2的前两个谐波中存在显著的信号。RC1成分三个谐波产生的潜伏期约为180.51±0.7 ms，这与ERP中N170成分有相似的时间；RC2成分前两个谐波产生的潜伏期约为261.84 ms（与之前的EEG和MEG研究显示视觉单词出现后250-350ms出现语音效应），RC1和RC2相比较的循环统计表明，RC2相明显长于RC1相。

当假字中的单词刺激出现在抖动的视网膜位置(条件2)时，产生的RC拓扑与在中心条件1中从反应计算的高度相关，在图4中，在公共分量空间中报告条件1和2的RCA结果， A所示成分RC1和RC2的拓扑结果与condition1下的结果相似，B展示了两种条件下两个成分分别重叠程度（矢量长度和矢量角度），图C显示四个谐波的反应幅度没有显著差异，潜伏期估计也没有显著差异。因此，本研究没有发现这些刺激具有局部适应的证据。RC1和RC2相比较的循环统计表明，RC2相明显长于RC1相。

在condition3中也有两个RC成分，条件1和3的拓扑高度相关，两个成分仅在第一谐波处具有显著性，循环统计表明，3 Hz处的RC2相位明显更长。

对于条件4和条件5，出现在其他两个语境中的词(非词中的词，假词中的词)产生了与不同拓扑结构相关的较弱反应成分。并且条件4中的RC成分仅在第三谐波处是显著的，条件5中没有谐波是显著的。