site stats
微软昨晚开源新模型:VibeVoice-1.5B TTS,可一次生成90分钟语音、多人对话效果听起来质量很高,在说话人一致性和自然轮转上都非常不错VibeVoice能生成90分钟连续语音,支持4个不同说话人,对像播客这种长篇音频内容生成比较实用
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多