对粤语声调产出差异的声学分析方法



1.参考文献 ¶

Barry, J. G., & Blamey, P. J. (2004). The acoustic analysis of tone differentiation as a means for assessing tone production in speakers of Cantonese. The Journal of the Acoustical Society of America, 116(3), 1739-. https://doi.org/10.1121/1.1779272

论文原文

2.研究背景 ¶

声调是F0和其他声学参数之间相互作用的产物。幼儿语音中的部分音高模式变得易于识别,可能反映出对韵律特征(音节持续时间)的控制增加以及对某些元音的习得。然而,并不能保证幼儿的语音产出确实与其语言系统发展相对应。早期语音对比的出现,部分原因是某些语音模式的出现频率较高。因此,幼儿产出的元音可能是偶然出现的正确构音,并且可能并不表示幼儿已经习得该元音。所以需要对幼儿的言语发展进行声学分析,以减少观察者的偏误。

粤语中有六个声调:声调55(高平调);声调25(高升调);声调33(中平调);声调21,(低降调);声调23(低升调);声调22(低平调)。粤语声调主要是通过F0结束点的差异来区分的。

对重度听障患者的声调习得和声调产出,以及人工耳蜗植入对声调发展的影响知之甚少。现有研究表明,听障的粤语母语者能成功地习得完整或接近完整的声调。原因:(a)声调在粤语中很重要;(b)语音产出过程中会强调声调;(c)声调出现在语音频谱的低频端,那里重度听障患者有最大的残留听力。

当前研究使用声学方法研究粤语声调产出的发展,以补充传统听觉转录分析的发现,提供了种量化声调产出变化的方法。从五个维度说明了听者对声调的感知判断。包括(a)平均音高,(b)方向,(c)长度,(d)极端端点,(e)斜率。 F0结束点与F0起始点的关系图说明了所有特征(长度除外),其中上升声调更接近y轴,而下降声调更接近x轴。

通过确定每种声调F0均值的点分布来计算每种声调的椭圆。首先使用声调周围点的主成分分析来计算每个椭圆的长轴和短轴的方向,将数据点投影到每个轴上,并计算投影的标准差。然后将椭圆半径设置为标准差的两倍,以包括每个轴上约95%的数据点。以这种计算方式产生的声调椭圆在视觉上概括了六个声调的位置。

还计算了两个指数,它们说明了说话者表现出的音高差异程度。

指数1-测量声调空间内的音高差异

在粤语的六个声调中,声调55、25和21是差异最大的。连接这三个声调椭圆的中心点,形成三角形。该三角形有效地覆盖了说话者使用的F0的平均范围,并定义了说话者的声调空间范围。椭圆的面积描述了每个目标声调的F0变化程度。At为椭圆的总面积,Ae1,2,4为声调55、25和21椭圆的平均面积,其中1=Tone 55、2=Tone 25和4=Tone 21。

图1

如果At / Ae1,2,4>2,这些椭圆之间重叠的可能性很低。如果结果<=2,至少在两个椭圆之间可能存在重叠。比率越低,三个椭圆之间的重叠程度就越大。

指数2 –测量声调之间的差异

像椭圆面积一样,椭圆所覆盖的两个轴的长度描述了每个声调的音高变化。因此,声调空间内的差异可以表示为六个声调的两轴长度的平均值(AveAx1+2)与六个声调中心之间的平均距离的比值(Ave Dist)。

图2

指数2与指数1相比有几个优点。它取决于所有声调而不是三个声调,对音高高度和轮廓的差异非常敏感。

对声调产出进行声学研究,是为了观察单个说话者产出声调的差异程度。椭圆之间的差异越大,说话者习得声调的可能性就越大。当前研究将说明如何使用这种方法来描述三组说话者在声调产出上的差异:(a)正常听力的成年人;(b)报告习得了声调的4-6岁的正常听力儿童;(c)语前聋的人工耳蜗植入儿童。

3.研究方法 ¶

五个听力正常的成年人;八个听力正常的孩子;16个语前聋的人工耳蜗植入者,都是粤语母语者。

语音产出任务,要求孩子们按要求产出声调。通过图片命名任务来实现,涉及每种声调的15个音节,共90个项目。测试中的单词是三岁及以上的粤语儿童经常使用的。以黑白图像的形式呈现。对所有语音样本进行录音和数字化,然后确定F0的起始和结束点。

4.数据分析 ¶

进行了三种形式的分析,以比较三组说话者的声调产出。首先,将所有语音标记的F0结束与起始点作图,以涵盖每种声调约95%的语音标记。其次,计算以下参数:(a)椭圆的轴长度;(b)椭圆面积;(c)每个椭圆中心点之间的距离。这些参数用于计算指数1和煮熟2,以用量化的方式表示每个被试的声调产出差异程度。第三,对三组说话者的语音产出数据进行转录分析,计算每个被试的正确声调百分比PCT。

5.结果 ¶

将组别和声调空间输入到Kruskal–Wallis非参数分析中。发现在所有声调上,三组被试的声调空间中位数存在显着差异。成年说话者的椭圆面积中位数最小,听力正常的儿童则有最大的椭圆面积中位数。在三组说话者中,人工耳蜗植入者有最小的声调距离。

三组被试的指数1中位数存在显着差异p<0.001。指数1的中位数为0.015(人工耳蜗植入者)、1.27(正常听力儿童)和10.28(正常听力成年人)。

在三组被试中,指数2的差异显着,p<0.001,中位数:0.32(人工耳蜗植入者)、1.17(正常听力儿童)和3.01(正常听力成年人)。两个指数的中位数均为CI儿童<NH儿童<NH成人。

平均PCT(声调正确产出的百分比),正常听力儿童的为78%。对PCT与声调空间面积At的相关分析表明,At与PCT显着正相关。

相比于正常听力的孩子,成人的混淆较少,尽管两者大多数的混淆都出现在声调33和22以及声调25和23之间。

6.讨论 ¶

研究的主要目的是开发一种分析声调产出的方法,以支持语音产出材料的听觉分析。绘制了F0结束点与F0起始点的关系图,以检查不同声调中F0的一般趋势。还开发了两个指数,用于检查声调产出之间的差异程度。结果表明正常听力成年人的椭圆较小,位于相对较小的声调空间中。听力正常的儿童有较大的声调椭圆,以及较大的声调空间。因此声学数据表明这些儿童的声调产出技巧尚未成熟。