1.文献阅读 ¶

（1）参数合成法：基于声学参数，在语音合成的过程中，通过对语音库中的声学参数的运用与调节来合成语音。比较典型的方法就是共振峰合成（klatt合成），运用共振峰滤波器模拟人的声道，然后对声道中的信号进行适当的调制和辐射合成语音。但涉及的参数太多，不易控制，合成的语音缺乏自然度。

（2）规则合成法：运用语音学的规则来完成语音合成，根据参数和规则直接把文字合成为所需的语音，典型就是基音同步叠加算法（PSOLA算法），不仅可以维持语音自然度，还可以自由调借时长和基频。具体步骤：1.取出所需的合成基元，并对合成韵律进行估算；2.对基元进行韵律调节；3.对基元进行拼接。

2.采用的方法 ¶

A.KlattGrid合成器 ¶

KlattGrid合成器是praat自带的脚本，通过对脚本的编写来生成在 F0 均值、F0 变化和发声方面变化的语音刺激。Zhang和Kriby（2020）研究F0线索在粤语声调感知中的作用，使用这个脚本完成了对音高轮廓斜率的改变，此外，这个研究中还提到了另一种自变量：发音模式（正常的发音、存在嘎裂声）。如果斜率和曲率会同时变化，没有办法控制的话，是不是也可以使用这个自变量？

思路：使用klatt合成器，合成参数参考中国科学院声学所80年代的声学数据，并参考Hazan（2000）的合成方法，得到更加自然的语音刺激。

问题：1.脚本涉及的参数很多，需要熟悉。

2.找不到中国科学院声学所80年代的声学数据，解决方法：1.继续查找；2.给声学所发邮件；3.找找看其他文献的声学数据。

3.可能合成的语音缺乏自然度，需要参考别的合成办法。

B.PSOLA算法 ¶

找到了PSOLA算法的Python代码，但是运行的时候存在问题。