site stats
或许是当前最好的带说话人识别的语音转文字方案?试了下Whisper + Nvidia Nemo, 比之前用PyAnnote效果好不少. (有更好的请告诉我!)另外实验了下, 做完这步后. 说话人名字也可以很方便的用LLM来根据文本内容来识别. (speaker 0 -> Elon Musk 这样)*附上了一段全自动生成的字幕作为展示
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多