Mel-Spectrogram

论文翻译(扩散模型来了):Diffusion-Based Mel-Spectrogram Enhancement for Personalized Speech Synthesis with Found Data

利用发现的数据来创建合成声音是具有挑战性的,因为现实世界的录音通常包含各种类型的音频退化。解决这个问题的一种方法是使用增强模型对语音进行预增强,然后使用增强后的数据进行文本转语音(TTS)模型训练。本论文研究了使用条件扩散模型进行广义语音增强,旨在同时解决多种类型的音频退化。增强是在对数Mel频谱领 ......
共1篇  :1/1页 首页上一页1下一页尾页