GPT-SoVITS：只需1分钟语音即可训练一个自己的TTS模型。GPT-SoVITS是一个声音克隆和文本到语音转换的开源 Python RAG框架。5秒数据就能模仿你，1分钟的声音数据就能训练出一个高质量的TTS模型，完美克隆你的声音！根据演示来看完美适配中文，应该是目前中文支持比较好的模型。界面也易用。…

发布时间: 2024-01-18 11:00:55

1分

数据加载中

2

1

0

GPT-SoVITS：只需1分钟语音即可训练一个自己的TTS模型。
GPT-SoVITS是一个声音克隆和文本到语音转换的开源 Python RAG框架。
5秒数据就能模仿你，1分钟的声音数据就能训练出一个高质量的TTS模型，完美克隆你的声音！
根据演示来看完美适配中文，应该是目前中文支持比较好的模型。
界面也易用。…
IT技术
( twitter.com )

3个月前由小互提交

GPT-SoVITS：只需1分钟语音即可训练一个自己的TTS模型。

GPT-SoVITS是一个声音克隆和文本到语音转换的开源 Python RAG框架。

5秒数据就能模仿你，1分钟的声音数据就能训练出一个高质量的TTS模型，完美克隆你的声音！

根据演示来看完美适配中文，应该是目前中文支持比较好的模型。

界面也易用。

主要特点：

1、零样本 TTS：输入5 秒的声音样本即可体验即时的文本到语音转换。

2、少量样本训练：只需 1 分钟的训练数据即可微调模型，提高声音相似度和真实感。模仿出来的声音会更加接近原声，听起来更自然。

跨语言支持：支持与训练数据集不同语言的推理，目前支持英语、日语和中文。

3、易于使用的界面：集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标签等工具，帮助初学者更容易地创建训练数据集和 GPT/SoVITS 模型。

4、适用于不同操作系统：项目可以在不同的操作系统上安装和运行，包括 Windows。

5、预训练模型：项目提供了一些已经训练好的模型，你可以直接下载使用。

GitHub：https://t.co/BpHX4SlsO3

视频教程：https://t.co/Uo7WtSSUGO

评论加载中...

您可能感兴趣的：更多

1

2

1

1

#AI开源项目推荐# GPT-SoVITS-WebUI
强大的少样本语音转换与语音合成Web用户界面。
功能：
1. 零样本文本到语音（TTS）：输入 5 秒的声音样本，即刻体验文本到语音转换。
2. 少样本 TTS：仅需 1 分钟的训练数据即可微调模型，提升声音相似度和真实感。
3. 跨语言支持：…
IT技术
( twitter.com)

2个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:17:30

2

2

1

1

#声音clone产品推荐
开源的实现：
1、GPT-SoVITS：对中文、英文、日文支持都不错，需要 10 分钟左右的干素材，瞬时 clone 的能力还没开放。
2、OpenVoice：对中文支持还可以，主打瞬时 clone，发展势头很好，一个月前测试的时候中文声音 clone…
时政
( twitter.com)

1个月前 • Leeoxiang #Tencent • -- 点击 0 评论

3

4

3

3

微软发布 Personal Voice：你可以克隆自己的声音说任何语言。
你只需要提供1分钟的语音样本，它就可以在几秒钟内克隆该样本语音，复制出一模一样的AI语音。
生成的AI语音支持中文、西班牙语、德语等多达100种不同语言的语音输出。
Personal Voice…
每日热点
( twitter.com)

5个月前 • 小互 • -- 点击 • 下载视频 0 评论

00:01:37

4

2

1

1

卧槽 !! GPT-SoVITS 确实牛逼
比起上次的 Birt-VITS, 耗时大大缩短了。下面克隆了海瑟薇小姐姐的声音，把她经典的时尚女魔头，街头变装的桥段，用女性视角，再重现一遍（最喜欢的一幕）
SOP:
1/ GPT-SoVITS 训练和推理声音
2/ ChatGPT 4 写脚本台词
3/…
IT技术
( github.com)

2个月前 • 黄赟 • -- 点击 • 下载视频 0 评论

00:01:00

5

2

1

1

使用GPT 4在浏览器中进行实时语音对话的实验

作者通过OpenAI API和 API建立了一个可以和GPT 4进行实时语音对话的系统。

只需要输入这两个API的key即可。

视频演示了作者和GPT 4玩对话猜物品的游戏。😃流畅度还是很不错的！…
IT技术
( twitter.com)

6个月前 • 小互 • -- 点击 • 下载视频 0 评论

00:04:19

6

2

1

1

150分钟语音转文字只需要1分18秒！
低端T4显卡，whisper large v3 蒸馏模型配合Flash-attention 2，速度起飞啊
时政
( github.com)

5个月前 • nash_su • -- 点击 0 评论

7

2

1

1

发现一个ChatGPT iOS端的妙用,当作语音输入法,。新开一个对话,专门输入语音, 输入完之后还可以请ChatGPT做一下语法, 错别字的检查,准确率非常高, 并且只需要用GPT-3.5就可以了, 不需要占用GPT-4宝贵的资…
IT技术
( twitter.com)

11个月前 • 白板报 • -- 点击 0 评论

8

2

1

1

AI VoiceOver：使用 OpenAI 的 GPT 4V API 和 TTS 可以识别视频里面的内容并自动为视频添加语音解说。
只需要上传100M以内的视频即可，系统会自动分析识别视频内容，然后生成解说词再转换成语音自动配音解说。
在线体验：
作者：
IT技术
( gptv-app.vercel.app)

5个月前 • 小互 • -- 点击 • 下载视频 0 评论

00:00:42

9

2

1

1

HeyGen推出Avatar2.0 ：Instant Avatar 即时虚拟分身
- 只需要5分钟，使用手机即可创造一个自己的虚拟分身。
- 多语言支持：通过内置的翻译工具，支持创建多语言内容。
- 口型同步：支持口型同步和多语言声音匹配
- 免费使用：而且这项服务是免费的...…
IT技术
( twitter.com)

5个月前 • 小互 • -- 点击 • 下载视频 0 评论

00:00:29