实验材料准备进展



1.文献阅读 ¶

(1)参数合成法:基于声学参数,在语音合成的过程中,通过对语音库中的声学参数的运用与调节来合成语音。比较典型的方法就是共振峰合成(klatt合成),运用共振峰滤波器模拟人的声道,然后对声道中的信号进行适当的调制和辐射合成语音。但涉及的参数太多,不易控制,合成的语音缺乏自然度。

(2)规则合成法:运用语音学的规则来完成语音合成,根据参数和规则直接把文字合成为所需的语音,典型就是基音同步叠加算法(PSOLA算法),不仅可以维持语音自然度,还可以自由调借时长和基频。具体步骤:1.取出所需的合成基元,并对合成韵律进行估算;2.对基元进行韵律调节;3.对基元进行拼接。

2.采用的方法 ¶

KlattGrid合成器是praat自带的脚本,通过对脚本的编写来生成在 F0 均值、F0 变化和发声方面变化的语音刺激。Zhang和Kriby(2020)研究F0线索在粤语声调感知中的作用,使用这个脚本完成了对音高轮廓斜率的改变,此外,这个研究中还提到了另一种自变量:发音模式(正常的发音、存在嘎裂声)。如果斜率和曲率会同时变化,没有办法控制的话,是不是也可以使用这个自变量?

思路:使用klatt合成器,合成参数参考中国科学院声学所80年代的声学数据,并参考Hazan(2000)的合成方法,得到更加自然的语音刺激。

问题:1.脚本涉及的参数很多,需要熟悉。

2.找不到中国科学院声学所80年代的声学数据,解决方法:1.继续查找;2.给声学所发邮件;3.找找看其他文献的声学数据。

3.可能合成的语音缺乏自然度,需要参考别的合成办法。

找到了PSOLA算法的Python代码,但是运行的时候存在问题。