site stats
这个工作量应该不小的。这个里面大概经过了语音识别,这个应该是Whisper。 然后是做了一部分都voice clone,提取语音的音色等参数,然后再把数据给 tortoise-tts 合成带原始说话人音色的语音。然后还要做一部分的 lipsync。这个估计是拿wav2lip做的。…
sign_in_with_google sign_in_with_google

2543 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前