SVS笔记

2022-09-01 本文已影响0人 bergsail

1、两种声码器，神经网络声码器，world声码器

神经网络声码器把声学特征，比如梅尔谱转为波形

world声码器通过频谱分析比如fft得到参数参数，然后参数合成波形

2、输入数据大概分三类 pitch durtion content 。内部模型设计也可对应

3、拓展和优化有几个方面

a、高精度

b、数据对齐

c、speech 2 song

d、迁移学习特定teacher

上一篇下一篇

猜你喜欢

热点阅读