言语语境和非言语语境对粤语声调感知标准化的影响不同



1.参考文献 ¶

Zhang, C., Peng, G., & Wang, W. (2012). Unequal effects of speech and nonspeech contexts on the perceptual normalization of Cantonese level tones. The Journal of the Acoustical Society of America, 132(2), 1088-. http://doi.org/10.1121/1.4731470

论文原文

2.研究背景 ¶

在言语产出中,说话者间和说话者内的差异很大。尽管声学差异很大,听众仍可以很容易地识别出单词。这种现象被称为说话者标准化(talker normalization)。在声调语言中,声调识别主要涉及说话者间和说话者内的F0差异。此项研究在声调感知中研究了说话者标准化,即如何识别不同说话者所产生的相同声调。将该过程称为“声调标准化”(tone normalization)。

粤语的声调可以探究声调标准化的机制。粤语分为三个声调:高平调(/ji55/医),中平调(/ ji33/意)和低平调(/ji22/二)。说话者间和说话者内的差异会导致粤语声调出现感知歧义。为了解决感知歧义,包含F0线索的语境是必不可少的。此项研究探讨不同类型的语境对粤语声调感知标准化的影响,这可能对声调标准化的机制提供启示。

A.言语语境效应 声调感知的线索有两种:词内线索和即语境线索。词内线索包括F0、持续时间、强度、言语质量等,其中F0是声调感知最重要的线索。语境线索对声调感知的影响已在文献中进行了广泛研究。Lin和Wang(1984)研究了语境中的相对F0高度如何影响汉语声调感知。发现了一种相反的语境效应,在高F0语境中被试更多地认为目标词是低平调,而在低F0语境中相反。这表明被试可以根据周围语境的音高调整目标词的声调感知。也有研究使用粤语声调,报告了相同的结果,而且与目标词相邻的词有更大的影响。目标词前后的语境效应也不同,听者倾向于依靠目标词后的语境进行声调标准化。

B.非言语语境 非言语语境对声调标准化是否有类似的影响?一种观点认为,言语与非言语不同,是通过特定语音加工机制进行加工的。另一种观点提出了一种通用的感知机制,认为该机制是言语和非言语加工的基础。此项研究旨在研究粤语中言语和非言语语境的影响。 此外,考虑到说话者间的F0差异,选择F0不同的说话者进行录音,测试言语和非言语语境是否相似地促进了F0不同的说话者标准化。

C. F0范围和均值F0 目前不清楚哪种F0线索有助于声调标准化。可以根据语境的F0轮廓,也可以使用说话者的平均F0,进行声调标准化。但是没有研究比较非言语语境中的平均F0和F0轮廓。与使用平均F0的非言语语境相比,由原始F0轮廓合成的非言语语境跟言语语境更相似。如果通用感知机制成立,那么具有原始F0轮廓的言语和非言语语境在声调标准化方面可能同样有效。

D.研究目的 调查不同类型的语境如何影响粤语说话者间和说话者内差异的感知标准化。提出两个问题(1)声调标准化是通过语音特定加工还是一般感知加工来调节的?(2)声调标准化是基于说话者的整个F0范围(语境的F0轮廓)还是平均F0?

采用被试内2×2因素设计,言语类型(言语和非言语语境)×F0类型(F0轮廓和平均F0),共四个条件。招募四个F0范围不同的粤语母语者(2名女性,2名男性),比较四个条件对不同说话者声调标准化的影响。

对于问题(1),如果言语和非言语语境的影响相似,就为一般感知解释提供了证据。但如果只限于言语语境,则意味着声调标准化是由特定于语音的机制介导的。

对于问题(2),如果F0轮廓和平均F0的语境显示出相似的效果,则表明说话者的平均F0足以进行声调标准化。但如果只有F0轮廓起作用,则表明说话者的F0范围对于声调标准化是必不可少的。

3.研究方法 ¶

16名粤语母语者(8名女性;平均年龄22.6岁)。没有听力障碍或长期音乐训练。

四位粤语母语人士(2位女性,2位男性),有不同但重叠的F0范围(FH:180~350 Hz,NL:180~280 Hz,MH:110~190 Hz,ML:80~130 Hz)。被要求大声读六遍句子:请你读意嚟听下/tshi˛25lei21tuk22 ji33 lei21thi˛55ha23 /(请读/ji33/)。意/ji33/(中平调)是目标词,其余部分作为语境,语境包含说话者F0范围的线索。提取每个说话者产出目标词/ji33/的持续时间和强度并进行标准化。持续时间标准化到500 ms;目标词的峰值强度被标准化为60 dB。

改变言语语境的F0,以研究语境的相对F0如何影响声调感知。根据三个粤语声调的感知距离改变语境的F0(高平调比中平调高三个半音,中平调比低平调高两个半音)。假设相同的目标词/ ji33 /(中平调)在降低F0条件下感知为高平调,在不改变F0条件下感知为中平调,而在升高F0条件下感知为低平调。通过改变语境F0产生了12个句子(4个说话者×3种类型的F0),构成了言语语境的F0轮廓条件。平均F0条件则把每个言语语境的原始F0轮廓替换为每个语境的平均F0。然后分别从F0轮廓和平均F0条件提取言语语境的F0轨迹和强度,并用于合成非言语语境。

目标词被嵌入到言语和非言语语境中(/ji33/被嵌入同一说话者的语境中)。除测试项目外,还包括由四个说话者产出的填充句。测试项目与填充句的比例为3:1。

分为五个模块。第一模块包含独立的目标词,即四个说话者产出的/ji33/,用作检查没有语境线索下的说话者标准化。其他四个模块对应于四个条件,即F0轮廓的言语语境,平均F0的言语语境,F0轮廓的非言语语境和平均F0非言语语境。对于第一模块,要求被试将目标单词识别为三个粤语词中的一个,即医(/ ji55 /),意(/ ji33 /)和二(/ ji22/)。对于后四个模块,要求被试注意整个句子的发音,并在整个句子出现后识别目标词。要求被试在三秒钟内按下计算机键盘上的按钮来做出反应。

4.分析 ¶

使用了两种类型的分析,感知高度分析和识别率分析。在第一个分析中,根据感知高度对被试反应进行编码。按照感知尺度,高平调反应编码为“6”,中平调反应编码为“3”,低平调反应编码为“1”,6、3和1表示声调反应的感知高度。如果平均感知高度接近于1,则表明大多数刺激被识别为低平调。如果接近6,则表明大多数刺激被识别为高平调。第二个分析计算了每个被试在语境F0变化(升高,不改变和降低)和每个条件(4+1个条件)的声调的识别率。

5.结果 ¶

图1

对四个语境条件下的感知高度进行了方差分析。言语语境类型(言语和非言语语境),F0线索类型(F0轮廓和平均F0)和F0变化(升高,不改变和降低)为三个被试内因素。 言语语境类型和F0变化有明显的主效应,p<0.05,p<0.001。两个显著的双向交互作用:F0变化和言语语境类型,p<0.001;F0变化和F0线索类型,p<0.01。三向相互作用也显着,p<0.01。这表明,改变语境的F0可以改变对相同目标词的感知,并且F0变化的影响受言语语境类型和F0线索类型来调节。

进一步对言语语境类型×F0变化和F0线索类型×F0变化进行了方差分析。总体而言,F0变化和言语语境类型存在显着的交互作用,表明言语语境和非言语语境的影响不同。在言语语境中,F0变化都改变了感知高度(无论是F0轮廓还是平均F0),使得目标词/ ji33 /在F0升高的条件下被感知为低平调(接近1),并且在降低F0条件下主要感知为高声平调(接近6)。但是,在非言语语境中的F0变化对声调感知没有明显影响。

然后对F0线索和F0变化进行方差分析。F0线索类型和F0变化的交互作用只在言语语境中显着; p <0.01。表明原始F0轮廓和平均F0在言语语境中对声调感知有影响,而在非言语语境中则没有。比较言语语境中的F0轮廓和平均F0,发现F0轮廓条件在引起预期声调反应方面更有效。

分为三个F0变化条件,并进行识别率分析。根据第一个模块的数据,发现如果没有语境线索,则无法正确识别除FL以外的说话者产出的目标词,表明被试受到说话者F0范围的强烈影响。一些说话者产出的粤语更容易被识别(FL),可能与被试对粤语说话者的平均F0范围的预期有关,F0范围更接近平均值(FL)的产出可能更容易标准化。

两个非言语语境和平均F0言语语境,总体识别率似乎有所提高。然而,两个男性说话者的识别率均未达到显着水平。表明这三个语境的F0线索不足以标准化由两个男性说话者产出的F0高度模糊的词/ji33/。只有F0轮廓的言语语境始终促进了四个说话者的标准化。在两个言语语境条件下,四个说话者的识别率均显着高于机会水平。

总而言之,识别率分析的结果证实了语音和非言语语境的影响不同,只有言语语境持续促进说话者标准化。

6.讨论 ¶

当说话人的F0未知时,对粤语的平均F0范围的了解可能会促进说话者标准化(FL),但先验知识会引起声调感知上的偏差,尤其是当说话者的F0远离平均值时(MH和ML)。因此说话者标准化是一个过程,听者克服了先前的偏见,并在语音感知中调整到特定说话者的F0。为了减少先验偏见,包含说话者F0线索的邻近语境至关重要。听众可能会从语境中对说话者的F0进行预测。通过语境中的F0线索和单词内部的F0线索,听众可以修改先验的偏见,从而正确地识别由不同说话者产出的单词。

根据结果,只有语音语境有效地促进了声调标准化,说明声调标准化很可能会招募语音特定的机制,而一般听觉机制只扮演不重要的角色。此外,与F0轮廓相比,平均F0在声调标准化方面效率较低。