1.参考文献 ¶
Xu, Y., & Wang, M. (2009). Organizing syllables into groups—Evidence from F0 and duration patterns in Mandarin. Journal of the Phonetics, 37(4), 502-520. https://doi.org/10.1016/j.wocn.2009.08.003
2.研究背景 ¶
在多音节中,各个音节不是均匀地排列,而是分成不同的组。但分组的本质和其声学实现都尚不清楚。此项研究主要观察普通话中的音节持续时间和F0轨迹与音节分组之间的关系。音节被组织成韵律或韵律单位,称为韵脚。普通话中韵脚的大小从1个到3个不等,独立于语法。
Kochanski,Shih和Jing(2003)通过对F0调型进行定量建模研究了普通话韵律强度。定义韵律强度的方式是语境如何影响声调的实现:声调被实现得越充分,其韵律强度就越大。他们报告说,普通话在韵律强度方面倾向于表现出交替的模式,而在双音节词中存在明显的强弱趋势,进一步报告说,强弱模式在四个音节词中的重复程度更高,第一个双音节单元的韵律强度高于第二个。
关于汉语持续时间模式的实验数据。Xu(1999)报告说,双音节词具有短-长持续时间模式,Chen(2006)发现,四音节词在最后位置表现出3 1 2 4持续时间模式(数字越大表示持续时间越长),但在中间位置表现出3 1 2 3持续时间模式。这些模式对以前的理论提出了挑战。假设一个四音节词由两个双音节韵脚组成,则第一和第二个韵脚具有相反的强度模式。然后,一个相关的问题是与位置相关的延长是为了强调重音还是标记位置。
为了更好地了解重音-持续时间关系对F0的影响,要注意F0的动态模式与共振峰一样,是构音过程的产物。有证据表明,F0的测量与构音运动非常相似。Xu和Sun(2002)报告了以半音为单位测量时,F0运动的峰值速度与位于存在高度线性关系,例如唇,颌和舌的运动。峰值速度和振幅之间的线性关系已被建模二阶动力学系统。在这样的系统中,作为时间函数的位移表现出朝向系统平衡点的渐近轨迹。当出现不同的声调时,在声调的F0轮廓中也可以看到这种随时间的收敛。使用峰速与位移之比(以下称vp/d)以反映运动的“强度”。强度被视为参与接近目标的运动产生的肌肉活动的指标。给定强度水平,运动持续时间越长,运动结束时就越接近目标状态;同样,给定运动持续时间,强度越高,运动结束时就越接近目标状态。
另一个与强度有关的运动学参数是峰值速度与单向运动平均速度的比值,称为参数C,其计算如下:
P/A=C/T
其中P是峰值速度,A是运动幅度,T是运动时间。参数C提供了速度分布的形状指标,并已被用作构音强度的另一种测量方法。
本研究试图回答三个一般性问题:(1)F0变化的基本模式是什么?与普通话的音节分组有什么关系?(2)它们与音节持续时间有什么关系? (3)它们与发音强度有何关系? 通过检查不同长度的单词和短语的持续时间和F0轨迹,以寻找与音节分组有关的模式,涉及的参数包括位移,峰值速度,vp/d,运动持续时间和参数C。进行建模确定运动持续时间和发音的单独贡献。
3.研究方法 ¶
a.被试 ¶
在北京出生和长大,母语为普通话的被试。八名大学生,年龄在19-22岁,四名女性和四名男性。没有任何语言障碍。
b.刺激 ¶
词和短语放入载体中时,会自然形成1个,2个,3个和4个音节组。根据其声调组成分为两组。 一组由动态调的音节组成,包括R声调(all-R),F声调(all-F)和交替的R和F声调(RF)或F和R声调(FR)。预测all-R和all-F序列由于较高的构音运动压力而表现出降低的F0,而RF和FR序列由于较低的构音运动压力而具有更大的F0。在标记为R#RRR和F#FFF的序列中,第一个音节是单音节词,而RRRR和FFFF序列由两个双音节词组成。在另一组中,目标序列由静态调的音节(all-H)组成。载体分为目标前载体和目标后载体。在一半的试验中使用目标后载体。这些目标前和目标后载体确保目标序列始终构成一个与句子,并与其余部分很好地分隔开,即使没有停顿也是如此。All-R序列的目标前载体以R声调结束,使目标序列中的第一个声调与序列中其余声调有相同的高构音压力。相同的目标前载体也被用于FR序列,以产生与其余声调相同的低构音压力。出于相同的原因,all-F和RF序列的目标前载体以F声调结束,以产生相似的构音压力。所有H序列的预目标载体都以H声调结束。 为了控制焦点,每个句子前都有一个问题,这是为了防止主体说出带有非焦点的句子。对于all-R和FR序列,问题是“他怀疑什么?”对于all-F和RF序列,问题是“他相信什么?”这些问题会使被试始终将注意力集中在句子最后的单词或短语上。
包括两种说话模式,被用作交叉验证构音强度效果。(a)对话:被试舒适地坐在麦克风的前面,大声朗读句子,就像是对站在一米外的人说话一样。(b)演讲:被试站在麦克风前,像演讲一样大声朗读句子。
目标句子(目标序列+载体)及其问题重复了五次,顺序随机。句子的总数为:20个句子×2个位置×2种说话模式×5次重复=400:
c.程序 ¶
四名被试首先录制对话模式,然后是演讲模式。其他四名被试相反。确保被试在两种模式下使用相同的正常语速。对于每个试验,通过耳机向被试播放适当的引导性问题,然后被试大声朗读目标句子。要求被试不要在句子中间停顿。如果实验者判断不行,则要求被试复述句子。在开始试验之前,每个被试都要进行多次练习试验。
4.数据分析 ¶
使用Praat脚本(Boersma,2001)完成声学分析,生成准确的F0轨迹。对每个被试产出的动态调序列的F0曲线,计算以下变量。
MaxF0(st)-单向音高变化中的最高F0(半音为单位)。
MinF0(st)-单向音高运动中的最低F0。
F0位移(上升或下降)-相邻的MaxF0和MinF0的F0差值(半音为单位)。对于all-R和all-F,对于每个音节,都将相应地计算两个位移。
平均F0位移-声调位移的平均值,仅适用于all-R和all-F序列。
移动持续时间-相邻F0最大值和最小值之间的时间间隔。
峰值速度-速度曲线中的正极值和负极值,分别与每个单向音高运动的上升和下降斜率相对应。
vp / d-峰值速度与F0位移的比率。
平均vp / d-过渡和声调的vp / d比率的平均值。仅适用于all-R和all-F序列。
参数C =峰值速度/平均速度(= F0位移/ F0持续时间)。这是速度曲线的形状指标。在all-R和all-F序列中,每个音节都有两个C值,一个用于过渡,一个用于声调。
平均C-过渡和声调的平均C。仅适用于all-R和all-F序列。
平均上下循环持续时间-每个音节的过渡和声调持续时间之和,仅适用all-R和all-F序列。
对于all-H序列,有以下变量:
MaxF0(st)-音节中最高的F0。
平均F0(st)-音节中所有F0值的平均值。
持续时间-起始和结束之间的时间间隔。
为了确定与音节分组有关的F0和持续时间模式,并评估构音强度在分组中的作用。是首先分析的因素包括说话模式,声调序列,在句子中的位置,短语长度和声调,然后再专门研究与分组最直接相关的因素,即组内位置。通过vp/d和参数C来评估构音强度是否可能参与。
5.结果 ¶
a.说话模式 ¶
说话模式的两个效果:演讲模式下的F0高于对话模式;演讲模式下的F0位移大于对话模式。将说话模式(演讲/对话),句子位置(句子最终/非最终),声调(all-R / all-F)和短语长度(1-4个音节)作为独立变量的ANOVA分析。讲话模式对MaxF0,MinF0和Mean F0位移有显着影响,但对平均vp/d,平均C、上下循环持续时间没有影响。从对话模式到演讲模式,MinF0和MaxF0均显着增加,表明演讲模式中构音压力可能会增加。句子最终位置(没有后载体)和非最终位置(有后载体)的上下循环持续时间没有显着差异。这表明两个句子位置的平均音节持续时间没有显着差异。
说话模式和MaxF0存在显着的交互作用(p=0.004)。在演讲模式下,两个句子位置(最终和非最终)之间的MaxF0差异比对话模式下的MaxF0差异稍大。RF和FR序列中的F0位移要比all-R和all-F序列中的F0位移大得多。这与两种序列的构音压力差异有关。在all-R和all-F序列中,F0必须在音节的开始和中心附近转向。在RF和FR序列中,在音节的开始或结束处不需要F0转向。F0转向的减少似乎使F0产生了更大的位移。
b.句子中的位置 ¶
句子中的位置主要影响序列后半部分的整体F0。句子最终位置比非最终位置有更大的F0下降,并且差异在最后一个音节中最大。句子最终位置的持续时间也比非最终位置的持续时间更长。方差分析的结果表明,句子最终位置的MaxF0和MinF0均显着低于非最终位置,而句子最终位置的平均C高于非最终位置。但vp/d、位移和上下行周期持续时间差异均不显着。
在MaxF0上,句子中的位置和说话模式之间存在很小的交互作用(p=0.042)。这是由于在非最终位置的演讲和对话模式之间的差异比在句子最终位置的差异大。还有一个显著的三向交互作用:句子中的位置、声调、长度。这是由于在句子结尾处的单音节词为F声调时才会出现过低的F0(84.4 st)。
还观察了短语长度和音节位置的影响。随着短语中音节数量的增加,短语的总时长也会增加。但是这两个增量彼此之间不成比例,这是因为3音节和4音节序列中的中间音节非常短。
c.声调 ¶
all-R序列的整体持续时间显著长于all-F序列。声调和短语的持续时间也存在显着的交互作用(p = 0.008)。随着短语长度的增加,两个声调之间的持续时间差异变小。但持续时间差异的减小主要发生在初始音节中。还发现了声调对MaxF0和vp / d的显着影响。但是,在MaxF0上,声调和短语长度之间也存在显着的交互作用(p=0.001)。MaxF0上的交互作用是由于随着短语长度的增加,F声调的MaxF0减小,而R声调没有变化。
d.组内位置 ¶
分组表现在F0位移和运动持续时间的模式上,这些模式不仅随短语长度变化,而且随序列中位置的变化而变化。在所有多音节序列中,最后的音节是最长的,而初始音节是第二个最长的,第一个中间音节总是最短的,而第二个中间音节是第二短的。在平均F0位移中可以看到几乎相同的模式。
然而,平均vp / d显示了相反的模式:持续时间较长且位移较大处,vp/d较低。平均C的模式似乎与持续时间和F0位移更相似。
与RR + RR和FF + FF相比,R+RRR和F+FFF的第一个音节更长,其F0位移增大。最后三个音节的F0轮廓更像三音节序列。进行成对分析,比较了AB+CD和A+BCD序列每个音节位置的平均上下循环持续时间和平均F0位移。除了最终音节的持续时间和第二音节的位移之外,AB + CD和A + BCD序列之间的差异非常显着。与AB+CD序列相比,A+BCD序列中的第一个和第二个音节都显着延长,而第三个音节则显着缩短。最后一个音节也略有延长。 F0位移的差异也很显著。
e.all-H序列 ¶
表6显示了H序列的音节持续时间、MaxF0和MeanF0以及ANOVA分析的结果(口语模式,句子中的位置和短语长度)。相邻音节之间MaxF0的最大差异为0.19stt,与all-R和all-F组的F0值相比,该差异很小。音节持续时间基本与all-R和all-F的模式相同。长度不同的H序列的F0曲线之间的差异非常小。
6.讨论 ¶
此项研究的目的是找出在短语级别上是否存在与音节分组相关的一致的F0和持续时间模式,并探讨它们可能的潜在构音机制。通过一系列变量:最大和最小F0,F0位移和运动持续时间,峰值速度,vp/d和参数C。发现音节持续时间与音节分组最具有一致性。就1-4个音节的短语来说,持续时间在最终位置中最长,在初始位置中第二长,在中间位置中最短。 F0位移显示出与音节持续时间相同的模式。然而,vp/d却呈现出相反的模式。vp / d会随着持续时间的缩短而增加。这表明vp/d不能很好地作为刚度指标。由H声调组成的音节序列有没有与持续时间模式匹配的F0变化。因此音节分组似乎主要是用持续时间来调整的。