语素顺序的跨语言模式反映认知偏差:格数形态的实验研究



一、文献名称 ¶

Saldana, C., Oseki, Y., & Culberton, J. (2021). Cross-linguistic patterns of morpheme order reflect cognitive biases: An experimental study of case and number morphology. Journal of Memory and Language,118,104204. https://doi.org/10.1016/j.jml.2020.104204. 论文原文

二、研究背景 ¶

人类语言在组合有意义的单位(即语素)的方式上是非常多样化的。但是,语言的不同之处有:通常有多少语素附加到一个基上,它们是在基之前还是之后附加,语素中编码的精确意义是什么,语素和意义之间是否存在一对一的映射,等等。这篇文章关注的是,是否普遍的认知或心理语言学机制可能在形成语素顺序方面有跨语言的因果作用。文章以格数形态为例,做相应研究。

EX1

EX2

如图例子,在这类语言中,如下文(1a-c)中的例子所示,当显性数和格语素都与名词词根相连,都在名词词根之后或之前时,数的表达几乎总是更接近名词词根,而不是格的表达。相关理论认为,普遍的句法层次结构潜在地反映了语义,决定了顺序。和许多语言一样,派生语素比屈折语素更接近词根。从范围上看,这是因为派生语素改变了词根的词汇意义,从而产生了新的语素。而屈折语素更多的改变了词的语法意义。

事实上,除了类人学之外,并没有独立的证据表明,数字靠近名词词干的位置比格靠近名词词干的位置更受欢迎,在一系列的四个实验中,文章测试了学习微型人工语言的被试是否确实偏向于将数字语素放置在名词词干附近而不是格语素。这些实验也被设计来研究此类偏差背后的机制——尤其是这种偏差是由(绝对和相对)频率驱动的,还是由认知偏好(例如,范围同构排序)驱动的。

三、研究过程 ¶

范式:外推范式(extrapolation),早期被称为poverty-of-the-stimulus)。这意味着学习者接受的输入是设计成(至少)在两个感兴趣的假设(或模式)之间有歧义的:这里是两种可能的大小写和数字语素排序方法。学习者将接触到一种微型人工语言,其中有名词、格(宾格)和数(复数)标记。他们的输入指示了这些语素是在名词之前还是之后,在测试中,他们被要求说出话语,包括这些保留的例子。他们推断的顺序将表明他们是否偏爱将数字放置在最靠近名词词干的位置(例如,noun - number - case而不是noun - case - number)。

41名母语为英语的人

该词典包括三个半现名(semi-nonce)动词、四个现名(nonce)名词和两个现名标记(一个数字标记表示复数;一格标记表示宾格)。所有的单词的重音都在开头(initial)。

这三个半现名动词取自英语克里奥尔语:

kikim–kicking;poinim–pointing; straikim–straikim

名词:

negid–a burglar; nork–a chef; tumbat–a cowboy; vaem–a waitress

名词-字符映射是随机分配给每个参与者的。这两个标记也被随机地映射到以下集合中的数字和格语素:gu; sa; ti。句子中的词序总是Verbs-Agent-Patient。一半的参与者被训练的语言是名词性后语素(格和数字语素出现在名词词干之后),另一半是名词性前语素(格和数字语素出现在名词词干之前)。研究人员对参与者进行了三种不同类型的名词短语训练:由裸名词组成的名词短语、由带有显性数字形态的名词组成的名词短语和由带有显性格形态的名词组成的名词短语。

名词训练和测试。

Fig-1

在一组24个实验(每个名词6个)中,参与者首先被单独训练4个名词(图1,最上面一行)。在每次试验中,都会出现一个字符,在第二个字符之后,它的描述(一个空的名词)就会显示出来(拼字和听觉上)。在描述音频播放完毕后,角色及其文本描述会在屏幕上停留两秒钟,然后再进入下一个测试。参与者被要求大声重复每个描述。然后,通过名词选择任务和口头生成任务(每组12次,每组3个名词)对参与者进行名词词汇测试。在名词选择试验中,一个人物出现,参与者必须从两个选项中选择正确的名词;在口头制作实验中,一个角色出现了,参与者必须大声说出相应的名词,并在完成后按回车键。

单标记NP训练

训练被试用单个标记(数字或格)来学习名词短语。有三种试验类型:(1)一组2-4个独立的相同字符(仅限数字);(2)具有(不同的)单agent和单patient的事件(仅限case);(3)一个事件有一个复数的施事者和一个单数的patient(数字和案例,关键是每个标记都有一个不同的名词短语)。在每次训练试验中,参与者看到一幅图像,然后在第二秒后展示它的描述(正字法和听觉)。在音频描述播放完毕后,图像和文字描述会在屏幕上停留三秒钟。参与者被要求大声重复每个描述。

单标记NP理解测验。在图像选择任务中测试参与者对单一标记NPs的理解程度。在每次试验中,他们得到一个描述,并必须从两个数组中选择对应的图像。根据试验类型选择foil图像。对于裸名词和只有数字的试验,陪衬图像是相同的字符,但数量错误(例如,用单数代替复数)。对于case试验和数字&case试验,陪衬是相同的事件类型,agent和patient颠倒。

单标记NP书面产出测试。测试被试产生单标记NP描述的能力。在每次试验中,被试看到一张图片,然后输入相应的NP(s)。Case Only和Number & Case trial提供了动词形式,因此trial本质上是填空的。参与者被要求按回车键提交他们的答案,然后提供反馈(播放正确答案的声音,以及图像和正确的描述)。

双标记NP生产测试。在两个测试模块中,参与者必须先提供书面的事件描述,然后是口头描述,这些事件要求他们推断出保留的短语类型:两个标记的NPs,有多个patient(图1,底部一行)。增加这个书面任务是为了让参与者在最后的口头测试阶段之前熟悉保留试验类型。在最后一个关键测试区,参与者被要求用语言对所有试验类型进行口头描述,包括关键的拒绝类型。在每次试验中,参与者看到一张图片,并被要求大声说出描述。动词形式被提供给了关键的保留句类型,以及仅格和数格试验,因此这些试验本质上是填空。

实验结束后,参与者被要求回答一系列有关他们所学语言的问题。问题以文本形式呈现在电脑屏幕上(一次一个),参与者提供书面回答。首先,参与者被问及每个标记的意义单独(随机顺序)。其次,他们被问及每一个标记与名词的关系,也就是说,标记是出现在指代该字符的名词之前还是之后。最后,参与者被要求用他们流利的语言打字。

四、研究结果 ¶

Fig-2

图2是一个堆叠的直方图,显示了在两种条件下,在0-100%的试验中,口头表达遵循范围的参与者的百分比。在第5阶段进行的关键试验中,95%的参与者(几乎)完全一致,在95% - 100%的时间内按照预测顺序产生两个标记NPs。

Tab-1

如表1所示,截距(两种条件下参与者范围同构产品的大平均值)是正的且显著的,证实了产生范围同构顺序的对数概率高于概率,标记位置的影响不显著,这证实了无论标记的名称前或名称后的位置如何,这种偏好都成立。

五、讨论及其他 ¶

实验1的结果与假设一致,即被试的偏好反映了范围关系,即数字和格语素之间的关系,而范围关系又决定了数字与词干的距离(即数字与格的距离更近)。

但是,它们可能反映了英语用一个绑定的语素明显地标记(复数)数,但在名词上没有形态格标记(格标记仅限于代词,也许还有属格)。确切地说,这将导致人们更喜欢把数字放在更接近大小写的位置,目前还不完全清楚。一种可能是,英语使用者对数字标记的熟悉程度或可接近程度导致它更接近名词。在实验后的问卷中,100%的被试给数字标记物赋予了“复数”的含义,只有60%(24/40)的被试给案例标记物赋予了“物体”或“行动方向”的含义。

他们对case标记的解释依赖于标记的位置:85%(17/20)的参与者在名称前标记时给出了正确的含义,而在名称后标记时只有35%(7/20)给出了正确的含义。这可能是因为以英语为母语的人熟悉能表明这种关系的名词性前词汇,即介词——在85%的人正确地解释了名词性前位置的标记语,大约60%的人明确地用介词描述了格词性标记的含义。总而言之,参与者可能会一致认为:在名前条件下,他们可以把格放在数字之外,因为他们把格标记当作一个介词;在后名义条件下,他们可能把它放在数字之外,因为他们不确定它的意义。

对实验设计没弄明白。