汉语使用中的个性表达



一、文献名称 ¶

Qiu, L., Lu, J. H., Ramsay, J., Yang, S. S., Qu, W. N., & Zhu, T. S. (2016). Personality expression in Chinese language use. International Journal of Psychology,52 (6), 462-472. https://doi.org/10.1002/ijop.12259

论文原文

二、研究背景 ¶

​ 语言的使用反映了重要的社会和心理过程,研究表明,在各种英语写作样本中,个性特征(personality trait)和单词使用之间有着密切的联系。(Pennebaker & King, 1999; Pennebaker et al., 2003),但是,关于个性特征在其他语言的语言内容中的反映程度,人们知之甚少。比如汉语,由于汉语的使用广泛,理解汉语的使用如何与个性相关联,会进一步提高对世界上最大的语言社区的心理过程的了解。

​ 过去对个性和英语语言的研究经常使用语言调查和字数统计(LIWC;Tausczik & Pennebaker,2010):一个分析写作样本以评估某些单词出现频率的软件程序,通过将语法规则与各种心理测量量表的内容相结合,LIWC能够可靠地测量许多心理属性,包括情绪、性格、思维方式和社会关系(Tausczik & Pennebaker, 2010),LIWC统计了预定义类别中的词频,每个词都属于两大类之一:内容词(content)和虚词(function)(Tausczik & Pennebaker,2010)。尽管缺乏关于语言和人格之间联系的跨文化研究,但大量证据表明,人格结构——特别是五大——模型在不同文化中是稳定的(McCrae & Costa, 1997)。

​ 但是汉英之间有很多不同的语法规则。鉴于此,汉语很可能具有英语中不存在的语法和个性之间的联系,反之亦然。因此,我们预期相比于内容词中的个性表现,虚词中的个性表现会更少与英语对应,因为虚词的使用是由高度特定语言的语法规则决定的。

三、研究过程 ¶

写作样本:微博的两组用户——选社交媒体是出于生态有效性和可及性的考虑。两个样本分别来自于大陆的在线者(样本1)和海外的中国留学生(样本2)

研究1:样本1:内地在线招募。开发了一个软件工具,向5万名新浪微博用户发送了参与请求,这些用户(a)每天发布两条以上、不到50条微博,(b)使用新浪微博已超过1个月。共470名。都较为年轻。

​ 样本2:新加坡一所大型大学的90名中国学生,平均年龄=22.4岁

每位参与者都完成了五大人格问卷(BFI, Donahue, & Kentle, 1991)和人口问题(即年龄,性别和种族)

Tab-1

作者开发了一个软件工具,用它通过新浪微博API下载参与者的微博,然后移除其他人写的转帖、时间戳、地理位置和嵌入的网址等信息,以获得参与者写的原始文本。所有参与者都写了50多条微博。我们用日常语言中的相应短语替换常用的表情符号,并使用广泛使用的汉语词汇分析器ICTCLAS将书写样本分割成单词,在研究1中确定了7,180,608个单词,在研究2中确定了392,322个单词。随后,使用简体中文版LIWC来生成两个样本中的词频。除了一个类别(即第二单数代词)在研究1中的频率为1.45%,在研究2中的频率为0.94%之外,其余所有类别在两个样本中的频率都大于1%。

为了进一步确保我们关注的词类别相对稳定,从整个样本中随机选择一半的微博并将分析,将每个参与者的写作样本分成两半。继续对词频进行了相关分析,发现其余所有类别的相关系数都在中等以上,而两个类别(即确定性和感知过程)的相关系数在研究2中低于0.3。我们从进一步的分析中删除了这两个类别。

样本1的220个相关中有49个和样本2的220个相关中有19个在p < .05时显著,超过了概率。表2显示了在一个样本中与至少一种性格特征有显著相关性的单词类别。在表格中添加了一列,以显示这些类别如何与之前的英语样本中的性格特征相关联,以便进行比较(见表2中的列se)。

Tab-2-1

Tab-2-2

Tab-2-3

在至少一个样本中,人格特质和词类别之间有43个显著的关联(21个是虚词类别,22个是内容词类别),并且在两个样本中具有相同的方向。这些关联表明在两个样本中相对稳定的个性表达。

在人格特征和虚词类别之间的21种关联中,有7种(33.3%)在英语中也有。例如,外向性(extraversion)与人称代词(包括第一人称和第二人称单数代词)呈正相关,表明外向性倾向于关心别人。这与外向性的理论定义相一致,外向性与非人称代词(impersonal pronouns)呈负相关,表明外向者不太可能使用非人称性质的语言。外向性与否定(negation)呈负相关,并反映外向性与认知复杂性降低的联系。神经质与介词呈负相关,与英语文章中过去的发现一致。

在人格特质和虚词类别之间的21种关联中,有14种(66.7%)以前没有报道过。例如,责任心与人称代词(包括第一人称单数和第二人称复数)呈负相关,这表明有责任心的人较少关注人际关系问题,因为人称代词表明注意力集中在人身上,责任心也与介词相关,介词是一种语言特征,表示对精确性的关注。

在人格特质和内容类别之间的22种关联中,有17种(77.2%)与过去在英语中的发现一致。外向性与社会过程有关,这种关系在许多英语样本中一直存在;宜人性agreeableness与包容性和相对性(包括空间和时间)词汇呈正相关;责任心与时间、工作和成就相关,这也支持过去的发现并反映了这样一个事实,即尽责的个人是以成就和勤奋为导向的。

在人格特质和内容类别之间的22个关联中,只有5个(22.7%)是新的。外向性与生物过程相关,这表明外向者比内向者更多地提及与饮食等相关的话题。神经质neuroticism也与成就词呈负相关,支持了神经质与工作绩效之间的负相关关系.

上述结果表明,尽管以前在英语样本中没有发现与虚词类别相关的66.7%的个性表达,但与内容类别相关的个性表达中只有22.7%是新的。这支持了我们的假设,即与虚词类别相关联的个性表达比与内容类别相关联的个性表达更可能是语言特定的。

在样本中,女性使用了更多的人称代词、差异词、暂定词和填充词,这与之前在英语中的发现一致;稍老一点的人使用较少的社交词汇和人称代词(包括第一和第二单数代词),支持了先前的结果,并表明他们更不经常参与社交活动,然而,文章发现年龄稍大的较少使用积极和消极的情绪词。这与之前英国关于老年人使用更多积极但较少消极情绪词汇的研究结果不一致。

为了检验观察到的单词-性格相关性是否取决于年龄和性别,文章通过控制性别和年龄来计算偏相关。在之前发现的相关性中,样本1中49个相关性中的31个(63.27%)和样本2中19个相关性中的15个(78.95%)仍然显著。这表明,虽然一些语言提示可能反映了与年龄和性别相关的特征,但那些仍然显著的语言提示可能与人格特征直接相关(见表2中的斜体相关性)。

因子分析根据词的自然共现对词进行聚类,以确定它们的共同话语功能。被用来揭示语言模式背后的心理结构。对样本1进行分析:首先,纳入在之前的对半分析中相关性较高(r>.7)的单词类别。其次,排除大部分包含在其他类别中的类别。例如,大多数介词出现在包含和排除类别中。因此去掉了介词范畴。第三,删除了不包含特定单词的类别(即总字数)。第四,与特定主题相关的类别被排除在外,因为它们反映了个人兴趣而不是心理过程。

Tab-3

表3就是相关的几个因素。

Tab-4

因素得分是使用加载到每个因子上的项目的加权和得分来计算的。将因子得分与参与者的五大人格维度相关联(见表4)。外向性与社会化呈正相关,与区分性呈负相关,这表明外向者比内向者更可能提及社会活动,但不太可能指出区分性。

为了检验上述因子结构的可复制性,我们对样本2进行了最大似然因子分析。诊断测试表明因子模型适合数据。这些结果表明,样本1和样本2具有可接受因子的一致性程度。

四、讨论及其他 ¶

​ 研究确定了汉语和人格之间的联系,并认为人格的语言表达既有普遍性的一面,也有语言特殊性的一面。首先,结果表明,许多单词-个性联想是独立于语言的。词类的心理意义在不同语言中表现出一定的稳定性。虽然汉语和英语有不同的语法和词汇,但它们都有一个表示区分的潜在因素。其次,有一些个性表达是中国人特有的。特别是,大多数与汉语虚词相关的个性表达在英语中还没有记载。这很可能是因为虚词没有真正独立的意义,它们的使用受到语言语法规则的强烈影响。

​ 但是,样本的文化背景不同,海外学生可能会受到他们所处的国家文化的影响,这一点与居住在内地的人是不同的;在线数据有偏向于更年轻、更精通技术的用户的局限性,并且可能会受到在线交流的独特规范和负担能力的影响,样本不能代表整个在线人群。未来的研究需要检查结果是否可以推广到其他样本。