软件介绍
GPT-SoVITS beta1.30多语言AI音色克隆软件由B站UP主@花儿不哭耗时研发的开源低成本AI音色克隆软件(GitHub Star7.9k),他也是知名声音克隆软件Bert-vits2和RVC变声器的创始人,按照他视频里的说法,本软件一分钟就能复刻声音(并且效果比今年1月爆火的人工智能语音公司ElevenLabs的技术好很多),还有5秒极限复刻模式,用于特殊情况。
我花了三天时间实测了一下效果确实很好,只需要半个小时就能训练出你想要的声音,并且1分钟的音频训练出来的相似度已经很高了,底下评论区置顶也有成功案例,因此来向大家推荐。
功能介绍:
零样本文本到语音(TTS):输入 5 秒的声音样本,即刻体验文本到语音转换。
少样本 TTS:仅需 1 分钟的训练数据即可微调模型,提升声音相似度和真实感。
跨语言支持:支持与训练数据集不同语言的推理,目前支持英语、日语和中文。
WebUI 工具:集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。
使用方法
一、从度盘或者123云盘下载整合包并且用7z或者Nanazip解压
二、解压完成之后运行”go-webui.bat”文件,直接双击就行,别右键用管理员身份启动,此时会出现一个黑色的控制台窗口,一定不要关闭它,关闭它程序就结束运行了
三、这个时候你的默认浏览器应该会自动弹出一个网页,如果没有弹出,那请你手动复制控制台上的网址进入,比如我的网址就是:http://0.0.0.0:9874,你可以看到网页内容是分为三个部分:0-前置数据集获取工具,1-GPT-SoVITS-TTS,2-GPT-SoVITS-变声,其中变声部分作者还在开发,所以显示还在施工中。