用眼动来测量儿童的动词知识怎么样呢?



论文信息 ¶

论文原文 ¶

明确的概念 ¶

1.接受性词汇和表达性词汇 2.CDI量表的介绍 3.文章里提及的眼动实验的三种指标 4.眼动实验的基本流程和原理

摘要 ¶

目的:作者使用动态的视频眼动测试,检查22-24个月大的婴儿的接受性动词知识。该试验的首要目的就是为了检验普遍用于研究名词知识的眼动方法,用其来研究动词知识是否有用。 方法:40个典型发育的婴儿,他们观看两个并排放置的视频(如,女孩拍手、女孩拉伸),随后要求他们找到其中一个(例如,她在哪拍手),他们眼睛的注视就会被眼动仪记录并作为一种他们的动词意义的知识的测量来进行分析。名词试次被用来当作对照组。作者检查了眼睛注视测量和CDI表达性词汇量表得分之间的相关,来看眼睛注视多大程度上预测CDI得分。 结果:1.在测试阶段,对目标视频比基线水平多15%的注视时间,所反映出来的知识的测量,的确和CDI相关,但是动词和名词不一样。2.看目标视频第一眼的延迟,对于名词来说,也和CDI得分相关,与前人研究一致,但是动词组的这种看目标视频第一眼的延迟和CDI是不相关的。3.注视的密度,对于动词和名词组都是和CDI相关的,尽管这种相关的方向不一样。 结论:与静态的描述名词的图片相比,描绘动词知识的视频的这种动态的本质造成了眼睛注视的不同。动词知识的眼动测量值得进一步发展。然而,使用什么测量指标也许会和静态图片和名词的指标不一样。

引言 ¶

1.why study toddlers’verb learning 理解婴儿是怎么习得动词的意义一直是最近几十年来语言习得领域的一个重要的努力。动词在语义和句法上都有很重要,还有研究表示,相比与名词的产出,婴儿在24个月时的动词产出更好地预测了他们未来的语法技能的发展。然而就英语婴儿来说,名词很容易,但直到进入第二年,产出的动词都很稀少。这种趋势,在理解方面也是一样的,6个月的婴儿就能理解一些常用名词,但到10个月他们也无法理解任何动词的意义。一些实验室的研究造新词给孩子们学习,孩子们需要更多的辅助学习帮助才能学会动词。许多研究表明在句法理解上,婴儿的理解的能力比产出的能力更好,但是,当他们开始理解基本的句法结构时,他们知道了多少个动词以及他们的动词词汇量时如何和句法同时发展的,这个很少人研究,因此,由于接受性词汇比产出性词汇普遍更早使用,必须对婴儿的接受性动词的词汇量有一个更好的理解(动词的学习很重要,动词的学习很困难,早期动词习得的研究很有必要) 2.the difficulty of measuring verbs and why eye-tracking 婴儿的接受性词汇量本来就很难测,更何况动词比名词更难测一些。1.家长的报告,家长报告是最常见的词汇量估计方法,但是对于动词知识,家长报告似乎不太准确,家长可能会把孩子对于某个常规活动的回应当作是孩子对动词意义的理解,另外这种报告也只是对不会说动词的小小孩有效,CDI量表就要求,当小孩超过16个月时,父母需要报告表达性的知识而非接受性的知识,因为当婴儿会说话的时候,父母就不能够很好的追踪他们的接受性词汇的能力。2.量表直接的测量,也许有用但也有限制,例如PPVT,让儿童来指一图片,仅对2.5岁以上的孩子比较适合,并且图片是静态的,从静态图片来推断动作可能对婴儿来说比较困难,因此可能会低估他们的动词能力。3.眼睛的注视是研究儿童语言理解的优秀的方法,它不需要口头或动作的回应,并且对语言障碍的婴幼儿来说也适用眼动实验使用了两种相关的范式:联动的偏好注视范式和边听边看范式,为研究儿童的语言能力提供了一个窗口。并且研究也发现,这种眼睛注视的方法是一种研究小小孩的名词词汇量的优秀的方法。但是却很少有人用眼动来研究动词,对于眼动研究动词来说有一个优势就是,不必再使用静态的简笔画了,可以直接上视频来描绘动态活动。(并且一个静态一个动态,很可能会有大的区别) 3.previous study——verbs acquisition 1.Huttenlocher们使用了动态的视频来测试动词知识,也是让孩子指正确的,发现22-42的儿童更能理解动作的动词如跳,而非改变位置或状态的动词,如bring。2.Golinkoff也用了眼动,播放12个动词的视频来研究16个月大的婴儿的动词理解。总的来说,他们发现了,相较于不匹配的视频,婴儿会更快且更多地注视匹配的视频。3.Naigles发现,17.5个月大的孩子知道六个测试动词中的一个ROLL,而到了27个月,证据表明了6个测试动词都知道了。4.然而Naigles2006,又测试了17个月大的孩子12个动词,发现动词词汇能力总体相对较强。5.目前测过最小的婴儿上6-16个月的,Bergelson发现,到10个月大,婴儿就表现出了理解抽象的词的证据,其中就包含一些动词。6.对于大一些的儿童Fornari发现3-6岁的孩子,发现了这测试阶段对目标图片的注视时间比基线水平更高,且和PPVT得分显著相关。 这些种种实验都表明,孩子在早期已经开始理解动词并且眼动也许会是一个很好的研究工具。但眼动在研究动词时仍会有种种的问题。同时,眼动提供了很多种测量,我们该用哪一种? 4.measures that eye-tracking provided 1.准确率/儿童花了多少的时间来看目标图片(与干扰项相比)2.延迟/儿童需要多久才能将他们的目光移向目标图片。这两种测量都和CDI的得分显著相关因此常常在研究里用来作为儿童的词汇知识的指标。然而对于动词这种变化的视频来说,这些眼睛注视的测量也许有不一样的结果,毕竟当动态视频播放时将会持续吸引注意力。因此当前研究的目的之一就是通过儿童观看动态视频时的眼睛注视的情况,来研究儿童的动词知识,但最主要的是研究这个作为前提的方法学的问题。作者通过研究不同的眼动的测量,来看哪些是对研究接受性动词知识有用的。作者主要针对22-24个月大的婴儿,这个时期婴儿刚刚开始说第一个动词,开始说两词句和三词句,在这个阶段儿童使用普通的词汇测验比较困难。3.注视密度,见5 5.what the task looks like? 采用16年某个研究的任务,同时呈现给儿童两个动态的描绘动词的视频,然后让他们指出哪一个视频是描绘目标动词的,只是在作者的任务里,就变成了记录眼动而非指了。作者的预期是24个月的儿童的接受性动词词汇量比16年研究的30个月的词汇量的80%还要少,然而重要的问题是,我们能否描述某个婴儿相对于其他婴儿的词汇量,这对于识别需要干预的儿童很有帮助。 作者选用了三种眼动研究的指标以及它们和CDI量表分别的相关,用这个相关来评判该指标是否是词汇知识的好的反映,尽管CDI是测的表达性的词汇知识,但它是这个年龄的标准测验。 同时,由于动词视频是动态的,而名词只需要静态的图片,因此作者预期眼动测量和家长报告的CDI之间的相关,在名词和动词间会有不同。除了先前提到的两个指标外,作者还用了第三个指标,注视密度,因为使用的动态视频都同样复杂且都不像静态图片。

方法 ¶

1.被试 40个22-24.9个月的婴儿,20女20男,正常怀孕,典型发育,没有超过30%的其他语言的暴露,英语环境养大,还统计了母亲的受教育程度、每年的家庭年收入。被试被分成ABCD四个组,每个组男女一样,在年龄和CDI得分上也没有差异。 2.材料和刺激 视频:选了36个较早习得的动词,75%都在CDI里出现过,其他的在一些实验中也有用过,最重要的是这些动词足够的具象,可以通过视频来呈现。还选了14个名词作为对照组。视频进行了配对,因此每个试次会描述同一个事件参与者。 音频:采用英语母语者,儿向语。对于名词就是‘饼干在哪里’,对于动词就是‘她在哪里拍球’,阶段如下: 2024-03-31-YXY-Fig1 先单个出现,再一起出现作为baseline阶段,然后进入提问阶段,此时屏幕上是一个五角星(避免儿童被视觉刺激分心以及使他们的注视点落在屏幕的正中心)。随后图片或视频再次出现,伴随着相似的提问。名词的图片持续时间更短,因为它是静态的,担心孩子看久了会无聊。先呈现左边还是右边的图片/视频在试次中平衡了。

每个孩子被分到四个子组,A和B的材料完全一样,只是提问的目标视频/图片不一样,例如如果A问她在哪里拍手,B就问她在哪里拉伸。采用这样的被试间设计而非被试内,一是时间太久,二是如果小孩采取排除机制就会夸大他们的词汇能力。C和D和A和B是完全一样的,只是颠倒了试次的顺序以排除呈现先后的影响。 3.程序 父母填写CDI随后父母和孩子被带到测试室,矫正眼动仪,然后进行两个热身试次,两个芝麻街人物出现在屏幕两边,然后指导语就问,某个芝麻街的人物在哪里。这是为了让孩子熟悉实验程序。然后就进行正式试次,18个动词试次和7个名词试次。 4.分析 作者主要关注基线阶段和反应阶段,把所有眨眼这种去掉,然后把所有两个图片/视频都没看的注视时间点去掉 一、作者首先检查了婴儿在反应阶段是否比基线阶段更喜欢注视目标视频/图片。作者对名词的图片和动词的视频分别分析。由于眼睛不能瞬间从一个位置移动到另一个位置,因此每个时间点的注视并不是完全和下一个时间点独立的,因此,作者通过汇总三个连续帧来形成50ms的time-bin,随后作者将这个time-bin数据使用经验logit功能转换。然后用混合效应回归,把转换后的timebin数据作为因变量,然后模型以被试和试次作为截距/随机效应,以时间、阶段(-0.5为基线阶段,0.5为反应阶段)、性别(和阶段同样的编码)、以及阶段和时间的交互作用作为固定效应。作为后验分析,还只对动词做了同样的分析,只是加入了属于一个主体还是两个主体的变量。还做了简单的t检验来看哪个动词是知道的最多的。 作者将其分为了两个时间段,基线和反应阶段的300-1800,较短的时间段和两个阶段的300-6000/3000,较长的时间段。因为前人的研究一般是1500ms,但是作者认为描绘动词的视频比较复杂,所以需要更长的时间段。 二、准确率,对于准确率的测量,作者选用了相较于基线阶段,在反应阶段对目标图片增加了15%的注视时间为标准,这是基于前人的研究决定的,15%是一个质的提升就表明了对词汇的接受性知识。作者把至少比基线水平多15%的试次的比例计算出来,然后和CDI的得分做相关分析,在短时间和长时间两个时间窗都做同样的分析。 三、延迟,延迟通常用于研究名词和静态图片的词汇加工的速度。也有人进行了动词的研究,发现只有1/6的试次的目标视频和干扰项的延迟存在显著差别。这很正常,因为视频是动态变化的,我们很难预测视频怎么抓住孩子的注意力。这种延迟可能只是反应的是基于动作的注意力转变,而非是识别出了目标。因此,虽然latency对名词和静态图片很有效,但对动词来说可能不是很好的测量。 作者将婴儿在反应阶段看向目标的至少持续100ms的第一帧作为latency,但是并不看视频刚开始的前50ms的数据。和CDI预期是负相关,因为latency越小,说明了表现越好。由于只关注第一眼,所以两个长短时间窗都一样。 四、注视密度。为什么会用注视密度?Henderson做了一些关于成年人是如何观察复杂的视觉场景的研究,它给成年人看静态但复杂的视觉场景(bar)以及一个语义相关的要素(cocktail)或是一个语义不相关的要素(microscope),结果发现,相较于语义相关的要素,成年人对于语义不相关的要素有着更高的注视的比例。 因此作者认为,婴儿可能会更仔细地检查那些和听觉刺激不相符的视觉场景,尤其是视频,可能就会对干扰项产生一些短暂迅速的check look,这并不表示没有对目标项的偏好。作者计算了对干扰项的注视数和对目标项的注视数的比例。然后在两个时间段里,计算这个密度和CDI得分的相关。 2024-03-31-YXY-Fig2

结果 ¶

1.初步分析:大体的注视模式 作者先分析名词和动词在基线和反应阶段的两个时间段里的大体的注视模式,以及在反应阶段对目标图片的注视是不是显著地比基线阶段多,然后再看每个动词的模式。 在基线阶段,对于名词和动词来说,目标图片和干扰图片都是50%的注视比例,表明婴儿在提问之前并没有什么注视偏好。而在反应阶段,对名词来说,有72%的时间注视目标图片而非干扰图片,动词有64%的时间注视目标图片,表明在提示语问题出现之后,婴儿的确把注意力转向了目标视频。注意所有分析都去掉了前300ms。 2024-03-31-YXY-Fig3 在反应阶段,名词和动词试次的儿童都更偏好注视目标图片/视频,只是动词试次比名词注视比例更小更稳定0.65,可能是因为接受性动词知识没那么稳固,可能对目标的偏好更小,也有可能是因为动态的视频持续地吸引小孩的注意力使得他一直偶尔回看干扰项,使得名词里看目标词的比例更大。 由于名词和动词试次包含了不同的刺激类型,静态vs动态,作者用了两个混合效应模型,一个名词一个动词,模型主要的目的就是看在反应阶段对目标的偏好是否比基线阶段更大,同时还要看有没有性别的效应。 结果如下: 2024-03-31-YXY-Fig4 阶段和时间的交互作用显示,动词试次,在反应阶段看目标视频的偏好比基线阶段更稳固和更强。而名词为什么没有这个交互作用和时间的主效应,作者怀疑是因为儿童快速的看到目标,但是他们对目标的偏好落在整个反应阶段。没有性别的主效应也很有趣,因为一般来说男性早期的词汇知识比女性更低。 同时材料里包含了两种动词,及物动词和不及物动词,婴儿显示对这两种结构都可以理解。有研究显示一个动词的参与者越多,动词越难学会,因此作者又做了一次混合效应模型,把动词trial的类型也加进去了,显示没有什么区别。 但是这个大体的趋势并不意味着对每个动词都很了解。 2024-03-31-YXY-Fig5 因此作者对基线阶段和反应阶段的动词的注视偏好进行了t检验,有36个动词,所以它用了bonforronni矫正,矫正后只有blow、hug,roll,tie.而不矫正的话,很多都显著:cry,dance,kick,rock,run,shake,spin,strech,wash以及上面四个。

2.Accuracy 把每个婴儿的反应阶段比基线阶段提升了15%注视时间的试次占整个实验的比例,和其CDI得分的相关性。在较短的时间窗内,只有名词和CDI显著相关,而在长时间的时间窗里,只有动词和CDI相关,恰恰相反。因此说明短时间窗适合名词,而长时间窗适合动词。

3.Latency 和预期一样,名词和动词的latency都是和CDI得分负相关,但只有名词是显著的。

4.注视密度 作者计算了名词和动词组里,长短时间段里,看干扰项的注视数量和看目标项的注视数量。在长时间段里没有发现明显的效应。但在短时间段里,发现了对名词和动词都显著的效应,但方向是反的。在长时间没有短时间有符合预期,因为时间长了注视就稳定下来了,而注视变化比较快的时候就是刚开始的时候。但怎么理解相反的趋势呢? 对于名词来说,干扰项相对于目标项的注视密度减少,CDI得分就增加,而对于动词来说,恰恰相反,对干扰项的注视密度增加,CDI的得分才增加。作者如此认为:1.在名词试次里,有更大表达性词汇量的婴儿会在目标图片有几个注视,而对干扰项几乎没有注视,因为一旦确定了干扰项是错误的之后,根本没有必要回看。2.在动词试次里,更大表达性词汇量的儿童可能会持续地观察干扰项,可能是因为想检查一下它确实不是目标,或者是想知道它是如何和目标不一样的。这并不代表儿童更偏好干扰项,儿童偏好目标项是由注视时间决定的而非密度,密度高表示了他们看了干扰项比目标项更多次。

讨论 ¶

总结一下:根据15%的注视时间增加的标准,婴儿差不多知道了一半以上的测试动词(36个总共)。这个材料最开始是16年的一个实验的材料,视频,但是让孩子指而非眼动,发现30个月大的孩子知道80%。 同时根据结果可知,名词和动词的确在眼动测量上有质的区别。首先注视时间上,动词只在长时间段里显著,说明小小孩动词的确需要更长时间段段分析,而名词不用,因为一旦厌倦就会乱看。 而latency似乎不是一个很好的测量动词的指标,因为作者认为,latency可能更多地和活动相关的特征有关系,而非词汇知识。 而对于注视密度,作者认为这是一个很好的研究动词知识的个体差异的指标。。。。。。。然后,只有1500ms这个短时间有效应,说明了注视模式后面可能就固定了。

局限 ¶

1.作者的材料把名词和图片绑定,动词和视频绑定,那么名词和动词引起的眼动结果的差异,到底是取决于名词和动词知识之间的差异,还是静态图片和动态视频的差异。未来也许可以同样都用视频来描绘名词和动词。 2.虽然在基线阶段,婴儿注视两个的比例是50%左右,但是实际上有的注视比例特别大,有的特别小,只是刚好平均了。 3.只用了CDI一个测评工具来评价儿童的词汇水平,太过局限。

ALLINALL:1.典型发育的22-24个月的儿童有了稳固并持续发展的动词知识。2.眼动来测量儿童的动词知识确实值得研究。