词汇化英语混合词加工的研究:来自阅读过程中词汇决定和眼球运动的证据



一、文献名称 ¶

Juhasz, B. J., Johnson, R. L., & Brewer, J. (2017). An investigation into the processing of lexicalized English blend words: Evidence from lexical decisions and eye movements during reading. Journal of Psycholinguistic Research, 46(2), 281–294. https://doi.org/10.1007/s10936-016-9436-0

论文原文

二、研究背景 ¶

​ 混合是一个由两个源词创造出一个新词的构词过程。当混合词继续在语言中使用时,它们就会被词汇化。比如smog(smoke+fog), blog(web+log)等。虽然混合词和复合词(例如farmhouse、airport)有一些相似之处,但它们的不同之处在于混合词中至少有一个源词被缩短了。虽然混合可以通过语音错误来创建,其中两个竞争的单词偶然拼接在一起,但是构词混合通常是有目的地创建的,以传达新的含义。分析表明,构词法混合在许多特征上不同于语音错误混合。

​ 就英语的流行程度而言,Simonini (1966)认为混合是十五种构词方法之一,并提出混合词约占英语新词的3%。混合词也被用作营销技术,可能在互联网上很常见。尽管语言学家已经提供了许多关于混合结构的描述,但是在语言处理任务中如何识别混合结构的关注相对较少。

三、研究过程 ¶

目的:检验词汇化混合词是如何加工的。与过去研究英语复合词相似,文章选择了熟练的成年读者相对熟悉的混合词,并将这些词在长度、熟悉度和频率上与非混合控制词进行匹配。

52名本科生,所有被试都报告说英语是他们的主要语言。

设计了一份包含82个混合词的问卷来评估参与者对这些词的熟悉程度。对25名本科生进行了问卷调查。他们被要求在1-7分的范围内评价他们对混合词的熟悉程度,如果可能的话,提供两个源词。从问卷中选出16个混合词。对于这些混合词,至少50%的参与者能够提供这两个源词。共有152个低频词被纳入熟悉度问卷。九名本科生被要求在1-7分的范围内评价他们对这些项目的熟悉程度。然后选择16个对照词,这些对照词在长度、熟悉度和谷歌点击率的自然记录上与混合词相匹配。

Tab-1

对于词汇决策研究,这32个关键项目被包含在一个包含88个单词(来自一项与词汇相关的研究)和120个长度匹配的非单词的列表中。

参与者在一个安静的房间里被单独测试。字母串以18pt Courier New字体的大写字母显示在电脑屏幕的中央。共有15个练习项目(8个单词,7个非单词)。在每个字母串之前,屏幕中央会出现一个1000毫秒的固定十字。字母串一直留在屏幕上,直到记录下回应。

​ 用线性混合效应回归模型(lmer)分析词汇决策时间,该模型包括受试者和项目的随机截距以及混合条件变量的随机受试者斜率。

​ 混合词的词汇决策时间比非混合对照词长,混合状态的影响是显著的。就模型中包含的连续协变量而言,熟悉度评分较高的单词得到的反应明显更快,较长的单词得到的反应时间明显更长,并且有一种趋势,即谷歌点击次数较多的单词得到的反应时间更短。混合词的准确率在数字上低于非混合词,尽管这种影响在模型中没有达到显著性。谷歌点击数和评价的熟悉度都显著影响准确率,因此更高的频率和更高的熟悉度导致更高的准确率。字长对准确性测量的影响不显著。

同实验一

记录每毫秒的眼球运动。参与者用双眼看句子,然而只记录右眼。

为实验1中使用的16个混合和16个非混合目标词编写了不可预测的句子语境,句子的结构使得目标词永远不是句子中的前两个或后两个词。目标词用小写字母书写,表2显示了每个条件的例句。除了包含目标词的32个句子之外,还创建了68个填充句子,这样每个参与者可以阅读100个句子。10个填充句是练习用的。

Tab-2

参与者被告知以他们通常的阅读速度默读,去理解句子。在每句话开始之前,他们会盯着屏幕左侧的一个黑匣子,这个框中的fixation会触发每个句子的显示。一旦参与者读完一个句子,他们被告知看句子的右边,并按下他们拿着的游戏手柄上的一个按钮。在十个练习句子之后,目标句子和填充句子会随机向被试呈现。25%的句子用来作是或否的理解问题,被试可以通过按下游戏手柄上的两个按钮中的一个来回答。

大约9.78%的试验数据由于各种原因被排除。

为了评估处理的时间过程,实验检查了四个注视持续时间测量:第一次注视持续时间、单个注视持续时间、注视(gaze)持续时间和总注视持续时间。

第一次注视持续时间是对目标单词的第一次注视的持续时间,与单词接收到多少次注视无关。单次注视持续时间是如果目标单词只接收到单次注视的话,该单词第一次注视的持续时间。凝视持续时间是读者将目光从目标词上移开之前,对该词凝视的总和。总注视持续时间是所有注视目标词的持续时间。

Tab-3

表3显示了作为混合条件函数的固定持续时间平均值。从该方法可以明显看出,当项目出现在句子上下文中时,混合词的注视持续时间比非混合对照词短。这种效应在第一次注视持续时间为9毫秒,单次注视持续时间为16毫秒,注视持续时间为30毫秒,总注视持续时间为38毫秒。混合的效果在第一次注视持续时间或单次注视持续时间中没有达到显著性。然而,这种影响在注视持续时间和总注视持续时间上都是显著的。

就模型中包含的连续协变量而言,熟悉度对单次注视持续时间和总注视持续时间都有显著影响,因此熟悉度较高的单词阅读时间较短。较长的单词接受了明显更长的注视持续时间,总注视持续时间的趋势是相同的。协变量的其他影响在模型中不显著。

​ 结果表明,混合词与非混合对照词的加工方式不同。在所有的注视测量中,混合词比非混合对照词读得更快。这种效应在注视持续时间测量和总注视持续时间上达到统计学显著性。凝视持续时间通常被认为是单词识别时间的一个理想衡量标准,因为它是在读者将目光移向另一个单词之前对该单词的所有注视的总和。因此,这一测量表明,当嵌入到不可预测但有支持性的句子语境中时,混合词比非混合词被识别得更快。

​ 具体来说,当采用词汇判断任务,并且要求参与者区分混合词和控制词与虚构的非词时,混合词比控制词明显有更长的反应时间。相比之下,当混合词和控制词被嵌入到支持但不可预测的句子中时,混合词的处理速度比控制词快,这种效应在注视持续时间和总注视持续时间测量中达到显著性。

​ 但是,在本研究中,混合词比非混合词在词汇决定上花费的时间更长的发现可能也是由于这项任务的特殊性。没有给参与者关于混合词的指示,并且参与者可能不愿意认可混合词是英语中的真实词。此外,在本研究中,混合词和非混合对照的出现频率都很低,许多混合词不出现在有效频率范围内。可能还得进一步排除其他变量的影响。同时可扩展到其他语言中来。