语言的根深蒂固:先验知识影响统计学习成绩



文献:Siegelman, N., Bogaerts, L., Elazar, A., Arciuli, J., & Frost, R. (2018). Linguistic entrenchment: Prior knowledge impacts statistical learning performance. Cognition, 177, 198–213. https://doi.org/10.1016/j.cognition.2018.04.011

原文

1.文章概述 ¶

统计学习(SL)通常被认为是认知系统发现输入中潜在统计规律的通用机制。然而,最近的研究表明,在跨模态和刺激的处理规律上存在明显差异,并且在视觉和听觉任务上的表现之间的相关性较低。为什么可能是领域通用机制显示出不同的模式和刺激特异性模式?

本文认为关键在于学习者为学习任务带来的先验知识。具体来说,学习者对于母语中的语音共现的期望已经根深蒂固,这会影响他们从新的听觉语言输入中学到的东西。相反,在处理诸如抽象形状之类的视觉材料序列时,学习者没有这种问题。

我们通过三个实验来支持这一假设,通过显示听觉-语言任务显示出不同的项目特定效果,导致测试项目之间的相关性较低,从而提供了证据。相反,非语言任务(视觉和听觉)显示项目之间的高度相关性。重要的是,我们还表明,视觉和听觉SL任务中的个人绩效与相关元素的同时出现并不具有高度相关性。在第四个实验中,我们通过显示听觉-语言统计学习任务中不同刺激之间的表现差异可以追溯到与参与者的母语相似,从而进一步支持了牢固性假说。我们讨论这些发现的方法学和理论意义,重点是SL的领域普遍性/特异性模型。

1.The tabula rasa assumption

已有SL研究经常假设学习者是一个白板,因此将学习视为吸收新规律的过程。按照这一假设,通常仅考虑输入结构即可了解实验的学习成果。

当学习时没有先验知识时(例,学习抽象形状),该假设正确。但学习语言时不存在符合这种假设的可能性,因为从出生时就开始听到语音,积累母语的语音知识。

2.本文的根深蒂固(entrenchment)假设

SL表现受根深蒂固影响的假说与现有研究结果兼容。有大量研究表明,参与者对SL任务的期望很容易操纵,从而影响任务绩效。

检验SL中的根深蒂固假设的一种可能策略是,确定根深蒂固的可能征兆:一种可以区分根深蒂固起作用和不起作用的操作措施。

3.内部一致性

当没有任何先验知识,因此没有关于流中元素共现的可能预测时,则所有模式在它们强加给学习者方面都是相等的。相反,如果项目在先验知识方面确实有所不同,则流中的模式就其施加于学习者的方式​​而言将是不相等的,因此,模式之间会出现一些差异。即在内部一致性较高的情况下,学习模式A会预测学习模式B,而在内部一致性较低的情况下,学习模式A不一定会预测学习模式B。

量化测试内部一致性的标准方法是通过Cronbach’sα的度量(Cronbach,1951)。α是测试中项目数(K),它们的平均方差(v)和它们之间的平均协方差(c)的函数。

公式

根深蒂固的假设具有非常明确的可检验的预测。1,使用新颖抽象形状的视觉SL任务不会暗示有关元素共现的先验预测,因此应显示出较高的内部一致性。相反,如果听觉SL表现暗示了我们假设的先验知识,那么这将通过较低的任务内部一致性来揭示,而与任务的整体性能无关。因此,在听觉SL任务中,使用一个“单词”的表现不一定会预测使用另一个“单词”的表现。2,该假设不暗示有关元素共现的先验知识的听觉SL任务将类似于视觉SL的内部一致性,而不是言语听觉SL任务。3,假设表明,听觉和视觉SL表现之间的零相关性(Siegelman&Frost,2015),可能不是由于先前提出的模态约束,而是在这两个任务中会涉及到差异的不同来源,其中一个涉及先验知识的巩固,而另一个则不涉及。如果是这种情况,则当两个任务都不涉及先验知识时,视觉SL任务的性能将与听觉任务的性能相关。

1.实验1a

  • 被试:55名大学生,平均年龄24.7岁

  • 实验设计:

包含16个辅音音节的语言,组成8个单词:4个单词(munatu, bateku, modane, lodogi) ,转换概率TPs=1(transitional probabilities,TPs);4个单词 TPs = 0.33 (kilegu, lekibi, biguki, gubile)

8个单词随机分成3分钟熟悉流,每个单词重复24次。

42个实验trials:前34个为强制选择任务,22个二选一,12个4选一,选择被试认为属于该语言的单词。后8个完成trials,目标音成对/三个一组出现,其中一个单词被白噪音替代,被试选择出该单词。

图1

  • 结果

图2

有显著小组水平学习。

  • 内部一致性

听觉SL任务的α= 0.42(95%CI:[0.2,0.64]),非常低。该值远低于用于任务评估的心理测量标准(α=约0.8,例如Streiner,2003)。与Siegelman等人的视觉SL任务中的Cronbach’sα值相比,该值呈现出明显更低的内部一致性。

为了确定这种内部一致性的差异绝不是由于视觉SL任务的更好表现而引起的(听觉SL任务正确的26.4 / 42试验与正确的听觉SL任务的22.38 / 42试验,p = 0.002),通过移除视觉SL中的12个最佳对象来匹配这两项任务中的表现,剩下的n = 50样本的平均表现为23.4 / 42,不再与听觉SL中的表现有所不同。该子样本的内部一致性确实较低,α= 0.76(95%CI:[0.65,0.86])。然而,听觉和视觉SL任务之间的内部一致性差异仍然非常显着(p = 0.003)。

2.实验1b

  • 被试:62名大学生,平均年龄23.18岁

  • 设计:

和1a相似,区别在于语音为16种日常非常熟悉的声音,使用软件进行处理,音长800ms.

图3

  • 结果:

平均性能为42项试验中有23.5项正确(SD = 5.6),明显好于任务的机会水平16.67(t(61)= 9.59, p <0.001)。平均表现与实验1a没有显著差异(t(1 1 5)= 1.27,p = 0.21)。

图4

听觉非语言SL任务具有很高的内部一致性,Cronbachα为0.73(95%CI:[0.6,0.84])。与实验1a的口头听觉SL任务相比,该值明显更高(p = 0.005)。此外,当样本和1a相匹配时,它与Siegelman等人(2016)报告的视觉SL任务的内部一致性结果几乎相同。

3.讨论

实验1a\1b为根深蒂固假设提供了支持,但二者的内部一致性结果不同。二者的区别可能是:语言刺激有先验知识,非语言声音没有先验知识。

考虑到情态的影响,听觉非语言SL任务的内部一致性似乎更类似于具有抽象形状的视觉SL任务的内部一致性,而不是言语听觉SL。这表明性能之间的相关性(或缺乏相关性)不是由模态约束(Frost等人,2015)驱动,而是由有关元素共现的先验知识驱动。在实验2中检验该假设。

  • 被试:

实验1b的42名被试同意进行后续研究,平均年龄22.76。

  • 设计:

首先对实验1b的听觉非语言任务进行了重新测试,然后进行Siegelman等人的视觉SL任务。对于听觉任务,虽然实验2中使用的声音与实验1b中使用的声音相同,但熟悉过程中的三连音会重新分配给每个参与者。初始测试(实验1b)和重新测试(实验2)之间的平均间隔为93.7天。

  • 结果:

1.重测结果:重新测试听觉非语言SL任务的平均表现为20.73 / 42(SD = 6.2),明显好于机会(t(41)= 3.81,p <0.001)。重测可靠性很高,估计为0.7(95%CI:[0.5,0.83]),该值与Siegelman等人报道的视觉SL的重测可靠性相似。这表明听觉非语言任务中的表现为SL个人水平的表现提供了稳定的特征,因此可用于准确估计与其他测量的相关性。

由于某种原因,重新测试的平均性能低于第一次测试时相同子样品的表现(20.73对23.73,t(41)= 3.81,p <0.001)。但是,这是我们研究的外围内容,因为这种干扰(如果有的话)会导致低估所观察到的与视觉SL的相关性。

对于听觉非语言任务,再次观察到较高的内部一致性,α= 0.76,重复了实验1b的发现。

2.视觉-听觉相关性

视觉SL的平均成功率为正确的26.04 / 42次试验(SD = 8.4),与Siegelman等人的结果相似。视觉SL和听觉非语言SL任务得分之间的相关性与根深蒂固的假设相一致,存在显着相关性。第一次测试后,视觉SL与听觉非语言SL任务得分之间存在相似的相关性。跨模式的SL表现与Siegelman的发现相反,显示视觉SL和言语听觉SL之间的相关性为零。

图5

  • 目的:

确保先前观察到的言语听觉SL和视觉SL之间内部一致性的差异不是由于Siegelman等人提出的任务的特质,或口头听觉SL任务中使用的“单词”(例如,其特定的音节结构或声学特性)导致的。

使用这些任务的更标准变体复制视觉SL和言语听觉SL任务之间内部一致性的差异,并进行不同的刺激。因此,在视觉和听觉SL中,采用了两个新的刺激条件,每个条件有6个三​​个一组(所有TP均为1.0),并且由36个2-AFC试验组成,TP设为0。假说预言了固执会影响

  • 被试:200名学生,没参加过实验1、2,平均年龄23.68

  • 设计:

1.听觉SL任务:听觉SL任务的两种刺激条件都是相同的设计,但是不同的材料(即,不同的音节和“单词”)。每种语言都由18个音节组成。在刺激条件1下,该材料的产生类似于实验1a:使用PRAT单独合成的音节(Boersma,2001),基频为76 Hz,音节持续时间为250-350 ms。条件2中的刺激是基于自然说出的音节的,这些音节是由希伯来语的母语人士录制,音节是单独记录的,以避免任何节律提示进行分段。音节的长度为220-360毫秒,频率范围为140 Hz至190 Hz。

在每种刺激条件下,将18个音节组织成6个单词(所有参与者都恒定),所有单词内TP均为1。然后将这6个单词随机化以创建一个熟悉化流,每个单词重复24个重复,单词之间不间断(熟悉情况下的单词顺序对于每种情况下的所有主题都是相同的),并且没有立即重复的唯一约束。熟悉说明与实验1a相似。测试阶段包括36个2-AFC试验,每个试验都包含一对刺激:一个“单词”和一个foil(TP = 0)。

表1

2.视觉SL任务:

两种刺激条件。条件1:16种形状;条件2:16种形状的Ge’ez字母。

6种三个一组,24次重复,测试为36个trials,每个trial中出现一种三个一组和一个foil,被试选择自己熟悉的形状。

表2

  • 结果

1.平均性能和内部一致性

在两种情况下,听觉SL任务的表现非常相似,刺激条件1的表现为24.16 / 36(67.1%),刺激条件2的表现为23.84 / 36(66.2%)。这两个值都代表了小组学习,显著区别于机会水平。在平行视觉SL任务中,平均效能相似,在条件1的刺激下正确的试验为23.86 / 36(66.3%),在条件2的刺激下正确的试验为23.01 / 36(63.9%),再次显示出显着的学习效果。

种视觉条件下的内部一致性都很高:抽象形状的α= 0.84,而抽象形状的α= 0.78。两种听觉条件下的内部一致性均假设为较差,条件1的α= 0.54,条件为α= 0.59。每个模态中两种刺激条件之间的内部一致性没有差异。使用不同的材料,在更常见的SL任务变量中,结果重复了实验1中观察到的模式。

2.因子分析Factor analysis

首先,预测视觉SL任务中由主导因素解释的方差将大于听觉SL任务的主要因素所解释的方差。其次,预测由于视觉SL任务中的所有试验利用相同的组件-从输入中提取过渡统计信息的能力,所有或大多数试验都将与主要因素相关。相反,在听觉SL任务中,根深蒂固会导致相关性分布不均匀。与某些三个一组相关的试验将包含主要因素,而与其他三个一组相关的试验则不会。

在条件1下,视觉SL任务的主要因素占观察方差的17.1%,在条件2下,视觉SL任务的主要因素占观察方差的14.6%。相反,在条件1下,听觉SL任务的主要因素占观察方差的10.6%。条件1,条件2中的10.1%。

在视觉SL任务的两个条件中,几乎所有跨越不同目标和foil的试验都被积极地置于主要因素上(条件1、34中的35/36试验)条件2的/ 36试用)。相比之下,附加的SL任务呈现出非常复杂的画面。在条件1中,对主要因素负有14/36试验,在条件2中,对主要因素负有10/36试验。这指向解释任务性能的不同方差源。

  • 被试:50个学生,平均年龄23.2

  • 设计:

使用实验1a中的口头听觉SL任务,实验1a(此后称为1a-FU)和实验3(条件1)的所有刺激(目标和foil)构成了实验材料。目标既包括单词(例如bateku),也包括部分词:具有较高TP的音节对作为目标(例如bate),共79个刺激。所有这些刺激都是由孤立合成的音节组成,持续时间为250-350毫秒。

被试在线完成任务。被试需要根据与希伯来语的相似性对每个合成的单词进行排名。1表示完全不相似,7表示非常相似。要求被试尝试使用量表的整个范围。在对79种刺激进行排名后,要求被试提供有关其性别,年龄,母语和他们所讲其他语言的信息。该任务共耗时5-10分钟。

  • 结果

1.目标和foil的排名

刺激的平均等级为3.27,差异为1.22(范围:1.76-5.98)。目标和foil的排名没有差异。但不是所有刺激的排名都一样,有的有显著差异。

图6

图7

2.排名可预测听觉SL表现

没有观察到单词的过渡概率的显着影响。这与非语言刺激的发现相反,后者中TP词是性能的更强预测指标。这再次表明,用言语材料完成任务的表现不能仅仅通过实验环节中输入的分布特性来解释,而是受其他因素的影响。

被试在包括与自己的母语更相似的目标在内的试验中表现更好,而且在使用希伯来语箔纸的试验中也表现出色。实验4的结果表明,根深蒂固不仅反映在各个项目之间的相关性,还反映在不同目标和foil的听觉SL表现中。

表3

先验知识对SL结果起关键作用。学习情境不涉及元素共现的先验知识,其特征是学习项目的内部高度一致性,而与情态无关。相反,当学习涉及语言材料时,被试的先验知识会导致内部一致性低。

1.证明视觉SL和听觉SL任务内部一致性的结论的可推广性。

2.SL研究应集中于提供系统的数据,用于构建和自然学习相符的模型。

3.不涉及先验知识的材料间存在显著相关性,说明存在一些通用计算,应该考虑其所指的材料和先验知识之间的关系。