基于经验的概率调节性别编码人工语言中的期望



一、文献名称 ¶

Öttl, A., & Behne, D. M. (2016). Experience-based probabilities modulate expectations in a gender-coded artificial language. Frontiers in Psychology, 7. https://doi.org/10.3389/fpsyg.2016.01250

论文原文

二、研究背景 ¶

本研究调查了口语形态复杂词和视觉参照物之间新关联的习得和后续处理。这项研究的目的是评估基于经验的概率是否被积极用于预测即将到来的指称,或者这些信息是否被其他消除歧义的信息所掩盖。如果积极使用基于经验的概率,处理的时间动态是什么?综上所述,这些问题对于理解在线语言处理过程中概率信息的激活,以及更普遍地理解理解过程中参照意义是如何(重新)构建的都有意义。

1、词语,参照物和概念表示

当我们单独听到“天鹅”这样的词时,我们更可能想象一只白天鹅而不是黑天鹅。 即使这个词没有明确地编码有关颜色属性的信息,这也不可否认地构成了这个词通常所指的鸟类的一个感知显著特征 ,与黑天鹅相比,白天鹅与我们最常遇到的天鹅是一致的,因此代表了一个更可能的参照物,也是一个更典型的潜在概念的实例 .

在语言理解过程中构建的心理表征在基于感知的信息方面是高度特定的,即,事件的心理表征包含的信息没有明确编码在输入中,但可以从经验中获得。许多研究报告了其他感知维度(如形状、方向和颜色信息)的类似发现(关于讨论和最近的复制实验,见Zwaan和Pecher,2012)。同样,当我们处理涉及人类的词语时,我们会激活关于这些词语是指女性还是男性的期望。例如,当听到“护士”这样的词时,我们可能更倾向于想象一个女人而不是一个男人。作为一种基于心理显著特征的非任意分类,性别分类为进一步研究基于经验的信息如何反映在与词汇相关的心理表征中提供了肥沃的土壤。

2.目前研究

为了克服一些与自然发生的概念表示相关的一些复杂性,以及自然语言中发现的可变性,本篇研究采用了人工语言。文章通过训练假词的习得和它们对一组假想数字的引用,建立了一个简化的指称系统,在这个系统中,单词与视觉参照物相联系,单词和参照物在可控且有限的维度上发生变化。伪词是通过后缀化来编码性别的,因此词干表示假想人物的整体特征,而后缀表示其性别,模仿自然语言中的结构

三、研究过程 ¶

实验由三部分组成:(a)前测,参与者熟悉将要获得的刺激物;(b)训练阶段,参与者学习新的单词指称关联;以及(c)后测,评估新获得表征的处理。在整个实验过程中,参与者的任务是识别给定单词所指的四个备选图像中的哪一个。虽然参与者在前测中会先猜测,但训练阶段应该会导致在记忆中建立新的联想联系,这将在后测中进行探索。对于每个反应,收集准确度和反应时间,并使用眼动跟踪来测量每个试验过程中观看的图像。

二十三名挪威人(12名男性,平均年龄为24.3岁),所有被试听力正常,视力正常或矫正至正常。

伪词由两个元素构成:词干和后缀。对于每个假词,词干都是指一个假想的数字,而后缀则表示其性别。从结构上看,这些假词可以与“police”“policewoman”等英语词形相媲美,从结构上看,这些假词可以与“police”/“policewoman”等英语词形相媲美,尽管这些假词(a)控制词长,(b)避免一般用法(例如,“police”一词有时与女性指称词一起使用),以及(c)避免使用具有独立语义关联的自由语素(例如,“police”)。从结构上看,这些假词可以与“police”/“policewoman”等英语词形相媲美,尽管这些假词(a)控制词长,(b)避免一般用法(例如,“police”一词有时与女性指称词一起使用),以及(c)避免使用具有独立语义关联的自由语素(例如,“police”)。尽管这些假词(a)控制词长,(b)避免一般用法(例如,“police”一词有时与女性指称词一起使用),以及(c)避免使用具有独立语义关联的自由语素(例如,“police”)。与英语一样,挪威语也是一种相对中性的语言,因为性别信息通常不在词汇层面编码(例外情况确实存在:“servitrise”和“politimann”在结构和语义上等同于英语的“waitress”和“politimann”,但越来越多地被中性的替代语所取代),与英语相比,挪威语是一种语法上的性别语言[例如,在语法上男性化的“bilen”(英语:the car),而在语法上中性的“huset”(英语:the house)。重要的是,对于指人的词,语法性别与指涉性别无关,大多数角色名词在语法上是阳性的。

该人工词库旨在通过后缀化对性别进行编码:12个假词干与两个不同的假后缀(“-tef”和“-tok”)配对,组成一个由24项组成的词库。

Fig-1

在目前的研究中,被试在理论上可以利用词干的语音线索来预测词干是以“-tef”或“tok”结尾,从而模糊了关于指称性别信息的真实时间点。因此,将24个原始记录的标记交叉拼接,即在音节边界处剪切音频文件(例如,“bontok”和“bontef”),以获得单独的词干和后缀音频文件(例如,“bon1”、“tok1“、“bon2”、“tef2“),然后重新组合以产生额外的标记(例如,“bon1tef2”、“bon2tok1“),因此,最终的刺激池包含每个单词的两个标记(即总共48个),可以互换使用。假词的平均持续时间为865ms,对每个单词来说,唯一性点(在指定它所指的24个数字中的哪一个方面)被定义为第二个音节中元音的起始:对于以“-tef”结尾的单词,平均uniqueness point为起始后440毫秒,以“-tok”结尾的单词,也为440毫秒。

视觉刺激旨在为上述人工语言提供参考,并描绘出男性或女性的假想图形。为了使图形易于相互区分,使用了以下全局特征:整体形状、颜色和表面纹理(例如,有光泽、毛茸茸、无光泽)。在第二步中,通过添加显著且一致的性别线索,获得这些人物的女性和男性版本:女性人物被赋予红唇和长睫毛,而男性人物被赋予较轻但较短的睫毛、略小的粉红色嘴唇和浓密的眉毛。重要的是,所有的性别线索都可以被视为面部区域的局部特征,而不是区分不同基础人物的全局特征。

12个词干中的每一个都与12个基本数字中的一个相关联,而两个后缀则与给定数字的性别身份相关联(见图1)。词干和基本数字之间的联系被随机分配给不同的参与者,其中一半参与者的后缀“-tok”被分配给男性,而“-tef”被分配给女性,而另一半参与者的性别分配则相反 。

参与者被告知,他们将熟悉在实验过程中获得的单词和图像,他们将在屏幕上看到四个字符,听一个无意义的单词,然后必须通过在其中一个图像上单击鼠标来猜测单词属于哪个图像 ,他们还接受了关于性别编码的指导:他们被告知每个后缀代表哪个性别,并给出了两个例子,让他们熟悉视觉性别线索。每一次试验都是从展示中心的一个固定十字架开始的。当这张照片显示500毫秒后,屏幕上出现了四幅图像(两个男性和两个女性)。在这四幅图像显示500毫秒后,耳机里会出现一个与其中一幅图像对应的伪字,而图像仍保留在显示屏上。后测中的视觉显示与前测和训练模块都不同,因为三种不同的试验类型(参与者内部)被用于调查加工的不同方面(图2)

Fig-2

无竞争试验:四个不相关图像,(例如,与单词“gontef”相关联的目标图像将伴随三个与无关单词“sjestok”、“kestef”和“lentok”相关联的干扰图像,使得后缀和视觉性别线索都是多余的) 。

目标竞争试验:包含一个与目标词相同的基本图形相关的图像,但性别相反。例如,根据图2,如果目标单词是“gontef”,那么与“gontok”相关的图像将位于干扰因素中,目标和竞争对手将仅通过后缀和本地性别特征来区分。

干扰物-竞争试验: 特点是两种干扰物仅在性别特征上有所不同。

四、研究结果及其他 ¶

由于性别编码对参与者是明确的,我们希望参与者在预测试期间就一直选择正确性别的数字(用后缀表示)。希望参与者在识别高概率项目时比识别低概率项目时更快,前提是概率信息在获取过程中得到跟踪,并且在识别过程中也容易获得。如果在反应时间中无法检测到基于经验的概率效应,这表明参与者确实激活了更抽象(性别更少)的表征。如果参与者主要依赖于语言编码的信息,则可能出现这种情况。最后,关于注视数据,我们希望能够充分获得刺激材料,以便观察词汇竞争效应等语言驱动模式。还希望注视数据能够提供关于概率信息在在线处理过程中变得多快的信息。