Insanely Fast Whisper:极速音频转录工具,能在98 秒的时间内转录 300 分钟(5 小时)的音频。
是一个基于 OpenAI 的 Whisper Large v3 模型的改进项目,旨在实现极快速度的音频转录。这个项目通过使用 🤗 Transformers、Optimum 和 flash-attn 技术,使得转录速度大幅提升。
提供了一个简单的命令行界面,用户可以通过几个简单的命令在电脑上使用这个工具来转录音频。
除了基本的 Whisper 模型,还可以选择其他版本,比如 distil-whisper,以适应不同的需求。
该项目目前只支持 Nvidia GPU。
提供了不同的配置选项,以最大化转录吞吐量。
GitHub:https://t.co/qBVm8NoeqF
在线演示:https://t.co/pJqz3kq9Bo
视频:测试几次来看16分钟的录音,大概是14秒到27秒估计是需要强大GPU才能实现宣称的效果!