不同的分析方法判断特殊语言障碍儿童的复杂句型是否典型



文献:RICHES, N. G. (2016). Complex sentence profiles in children with Specific Language Impairment: Are they really atypical? Journal of Child Language, 44(2), 269–296. https://doi.org/10.1017/s0305000915000847 论文原文

不明原因的语言困难通常被称为特殊语言障碍(SLI),此种语言困难不是与语言能力差有关的常规因素造成的,特殊语言障碍者形态语法受到的影响最严重。特殊语言障碍研究的核心问题是,这些孩子是否与正常发育的孩子有质的不同。可以在“宏观”和“微观”层面观察到质的差异,宏观层面指的是跨不同语言子域的表现,如形态句法、音系学和词汇,而微观层面指的是子域内的表现,如动词形态和名词形态。研究经常提到数据图表的差异,这是一种不同语言评估的表现模式。虽然不平衡的语言数据图表在SLI的诊断中不起作用,但对许多研究人员来说,它们构成了一个定义特征。如果没有这样的剖面差异,就很难将SLI作为一个独特的诊断类别,而不是描述处于常态分布尾部儿童的术语。然而,语言数据图表的实验调查与大规模流行病学/分类学研究之间存在着明显的脱节,前者表明患有特殊语言障碍的儿童具有性质上不同的语言系统,后者几乎没有证据支持这些儿童应被视为属于不同类别的说法,许多研究人员现在公开质疑SLI作为一种诊断。

本文研究的是复杂句生成过程中的数据图表,因此侧重于微观层面。它还侧重于横断面数据,而不是纵向数据。对语言复杂性没有统一的定义,但人们经常认为,当句子包含非规范语序时会更复杂。数据图表差异在特殊语言障碍研究中具有重要的理论意义,这使得人们认为特殊语言障碍中的语言是紊乱的,而不是弱的。通常,在横断面数据中,通过调查群体(主语间因素)和语言结构(主语内因素)之间的相互作用来探索概况,其中语言结构是语素的类型(例如名词词缀和动词词缀),或规范性。如果交互项是显著的,研究人员就会得出结论,不同群体的数据图表是不同的。 1,过去的研究都使用双向方差分析来分析计数数据。通常情况下,正常发育的孩子的表现接近上限,当比较能力差异很大的群体的数据图表时,这可以被视为一种职业危害。如果一个组的表现接近上限,数据的方差就会减少,即“天花板效应”,通常被认为是有问题的统计分析。这是因为如果方差在不同的组和/或条件之间差异很大,那么残差将偏离正态分布,将影响显著性检验。

2,方差分析的一种替代方法是使用广义线性模型(GLM),这是一种回归分析。这与构成方差分析基础的“一般”线性模型不同。GLM扩展或“泛化”了基本的线性模型,以便处理不同类型的分布。他们通过使用不同的“链接函数”,并假设不同的分布。从数学上讲,方差分析与简单线性模型没有区别。然而,GLM为处理不同分布的数据提供了更大的灵活性,并允许对不同方差产生的残差进行更好的建模。有证据表明,与GLM相比,当数据接近极端时,ANOVA方差分析的表现很差。GLMs可能是分析相互作用效应的更好方法,而不是会出现不平等方差的方差分析。GLM的另一个优势是,可以使用混合效果模型来控制分项和分项效果,方差分析无法做到这一点。 本研究使用GLM分析来自句子重复范式(SR)的数据,调查了有特殊语言障碍的儿童在涉及复杂句子(SR)生成的任务中是否表现出与典型语言同龄人质的不同。这项研究包含了两项方法上的创新。首先,使用GLM对数据的 分布进行建模。其次,它使用了编辑距离LD,这增加了统计能力并提供了敏感的性能指标。主要的假设是,由通过规范化交互分组所显示的数据图表将存在显著差异。除了LD之外,词序错误也被编码以提供更定性的性能度量。根据预测,在规范化交互分组中也会出现词序错误。

17名SLI儿童,21名语言能力相当的 (LM)儿童,17名年龄相当的(AM)儿童,语言匹配通过平均言语长度(MLUw)完成。

根据 (正规性) ×(长度) 设计生成100个句子。非规范句是宾语关系句和宾语疑问句。对于关系子句,混合使用了右分支从句和中心嵌入从句。句子成对创建,这样每个非规范句都有一个长度完全相同和使用完全相同单词的规范句。句子被分成8组,每组20个,并被伪随机化,17位精通语言学的研究者对句子对的合理性进行评价。SR任务用玩具鹦鹉和一本名为《八卦鹦鹉》的故事书来演示的。实验者把故事读给孩子听,在不同的阶段,鹦鹉对这个故事进行评论。实验者假装听不懂鹦鹉的话,所以孩子不得不帮助他重复鹦鹉说的话。鹦鹉还用于SR任务本身,该任务在笔记本电脑上运行。

定量误差使用LD进行推导,为此每个语素都被表示为一个独立的单元。通过对句子进行语素编码,算法将统计词缀的遗漏。此外,如果任何一个主词或主要动词改变了位置或句法功能,结构就被认为发生了变化。由于LDm是一个新的度量标准,对其进行了效度分析,表现良好。原始数据明显向右倾斜,其中有很高的零值率(即没有错误的句子),导致过度分散(其中方差大于平均值)。采用“负二项回归“和零膨胀来处理过度分散。

方差分析仅在SLI与AM对比中通过规范性相互作用发现了显著的组群。但GLM没有发现显著的相互作用。本研究的一个重要发现是,相互作用项的显著性取决于对统计模型的选择。虽然方差分析确定了显著的相互作用(SLI与AM),但没有观察到零膨胀的负二项回归,且p值差异很大。而对相互作用项的解释十分重要,决定了我们是否将SLI视为一种以语言系统特定子组件严重缺陷为特征的疾病,还是语言支持系统。概念化这两种分析之间差异的一种方法是考虑加性(方差分析)和乘性(GLM)模型,并且模型拟合的统计检验证明使用乘法模型是正确的,对SLI中处理速度的研究也证明了这一点。GLM和方差分析结果之间的差异支持后者可以虚假地夸大相互作用项的显著性。如果在数据图表上没有真正的差异,我们应该将患有特殊语言障碍的儿童定义为处于正态分布末端的儿童,而不是一个独特的诊断类别。虽然这一观点与大多数实验研究不同,但与大规模流行病学研究相一致。本研究的数据支持SLI儿童在主题角色分配方面存在困难的说法。

本篇文章深度解析了方差分析与广义线性回归的特点,提醒我们对于数据的分析不是墨守成规,要根据数据的特点勇于创新,在今后的研究中要关注数据处理方法,这也是我急需提高的能力。理解不同数据处理方法的特点,对其进行合理运用,才能得到更为真实可靠的实验结果。并且,对于某一问题的探索不必拘泥于实验方法,数据处理方法也可以作为一个切入点,这也是这篇文章令我记忆深刻的地方。