粉丝10获赞452
大家好,今天给大家介绍一个新的中文声音克隆项目,之前视频中有给大家介绍过声音克隆的项目, 克隆语言技术的开源项目主要有以下几个,五个开发的 open 半生,微软开发的 followee, 有拼音号开发的 os, 他都排队开发的 tn is colony。 声音克隆技术具有广泛的应用前景,他可以用于虚拟主播、有声读物语音合成。 之前介绍的克隆声音项目都是英语体系下训练出的模型,中文在此基础上出力,难免会有一股不自然的翻译腔。今天给大家介绍的是一个中文声音克隆项目, 这个项目只需一分钟的训练数据,就能让模型学习模仿声音,而且质量很高。另外这个项目的作者已经将这个项目整理为一个一键运行项目包,所以不用 不用担心安装的问题。现在我们下载这个项目,下载解压后双击 go a b c 大运行项目。首先让我们探讨人声和伴奏分离功能,这个功能用于去除音频中的背景音乐, its solves 已经将八分五整合到项目中, 当然你也可以用独立的 f 五来做去除背景音的工作。刚才的两段声音呢,是我用这个工具克隆的。董宇辉和陈小青的声音感觉怎么样呢?我觉得是非常棒,特别是陈小青说话的那个语气都有, 而且这个工具操作特别简单,训练速度也特别快。那我接下来继续给大家演示。接下来我们看到语音切分工具,如果我们的声音素材比较长,比如说一分钟,我们就需要用这个工具将音频 分成一句一句的,在第一个框里边,我们输入音频的路径,我的音频素材放在这个文件夹里,所以我这样复制他的路径, 然后输出的路径呢保持默认就可以,这样其他参数可以不用调,然后直接点击开启语音切割就可以,这里会有一个切割的进度, 后台会显示相应的信息,我们也可以在我们的这个输出文件夹,在在这个项目的 output 这个下边的 slinger, 这个可以看到已经有输出了,我们再回到这个页面看,这已经显示切割结束。接下来我们进行语音识别, 将文件输入文件夹路径改为我们刚刚切割的文件的这个路径,把这个路径地址复制到这个位置,然后点击可以看到后台已经开始运行, 等待进程运行结束以后,在 alt put 的 a s r alt 的这个输入目录会会输出一个文件, 这个文件里边包含了我们音频识别出来的文字信息,可以看到这显示 asr 任务完成, 我们看到我们的这个输出文件夹,刷新一下看,那我们接下来是文本校对标标注工具,这个是对我们刚才的这个识别进行一个检查的工作,我们可以把这个文件的路径复制过来, 加一个反,把这个文件拧复制过去,这样然后再点击这边的是否开启标准 ybui, 点击勾选这里,他就会新弹出一个窗口, 如果长时间没有动作的话,我们可以刷新一下,然后我们重新把我们刚才的这个路径复制到这里, 我们再次勾选这个收腹打开标准外不由外,打开以后可以看到是这样的一个页面,已经把我们的那个拆分的话给切断,然后显示出来。 在这个工具里我们可以教验刚刚识别的音频文字是否准确,我们可以听一些,我去这家餐厅还要要点什么,还有哪些菜,这个得扣几天,嗯,如果 他上来就找腮帮子的时候,鱼头第一筷子就是就是这个月牙肉啊。嗯,对于这些有杂音的或者是特别短的 这些,可以点击后边的 yes, 上面有一个 delete audio 的这个按钮,直接就可以删掉,这里最多存储的是十条,我们刚才删掉的两条,它会自动再上来补充两条, 所以我们可以接着检查问题,就是说,呃,我们这中这个, 呃,中餐这个独步天下差也比西餐高明这么多,对啊,就是所有人会有会有这种误解,不知道高到哪里去了,对吧?对于这种有杂音的,这个我也删掉它, 那我们就这样就不继续了。检查完了以后,点击这个 self feel 保存文件按钮,点击保存就可以,点击以后我们刚才 的这个文件就会有有所更新,有更新的可以看到这个时间点。完成教验音频操作以后呢,我们返回 gpd sos 的主界面,进入第二个环节,在这里我们输入模型的名字,我们可以命名一下, 这里呢我们是需要把刚才的这个文件夹的名字放到这的这个位置,这里呢是放我们的切割的文件 素材的这个文件夹复制,把这个路径复制到这也就是这里。这个 页面呢,需要这三个带星号的这三个地方填写了就可以,其他都可以保持默认,然后我们点击这个开启一键三连,现在就开始训练格式化的一个模型 程序英雄过程中呢,会在这个项目的 log 这个文件夹下会给创建一个文件夹,就是刚才我们的呃模型名,以模型名为名创建的这个文件夹,会在这个文件夹里边创建一系列的文件, 这一系列的文件是以二三四五六开头的文件,这里显示一键三连进程结束,就说明我们的这个这这一步已经完成。然后接下来进入下一步对模型进行微调, 上面的信息呢是系统自动给匹配过来的,然后我们可以我们直接点击这个开开始训练,可以看到 log 文件夹下又新生成了一些文件, 现在这里显示训练完成,我们就可以点击开启 gpt 训练,在训练完成以后我们进入第三个环节推理 在这呢,这些也是系统自动给传过来的这个模型名称,然后我们看下边 选择模型,我们选择这个啊,点击这刷新模型路径,点击后他会把加载新的进来,可以看到已经有了,我们选择这个有三个吗?我选 选择这个数字最大的,就是最新的一个最终训练的一个模型,然后这边也是这个窗口,以后可以看到这个模型也是刚才我们选择的,在这呢我们需要上传一个我们刚才切割的呃分段的语音素材,点击这里, 然后我们随机选一个希望选一个短一点的,然后我们播放一下才会有好的美食,把听到的声音的文字输入到参考音频的文本, 才会有好的美食。嗯,对,而且你我们都太,你从,嗯,中国来 说,北方人太随和了,太不挑剔了,太宽容了。有了这个以后呢,我们这就可以输入,我们的要想点击这里合成就会输出,但是下边会有一个切分的方式, 不签呢,他就正常的输出,然后我通常是选择按这个标点符号,他会更有节奏一点,我是这样认为,然后点击合成, 可以看到这里显示了一个错误哦,可以看到这是需要三到十秒的一个视频,因为我这上传了一个十一秒的,所以这里是不行的,那我们重新替换一个,这个可以,这个是六秒的,然后我们再把这删掉,这个 他家里不倾家荡产,他他肯定走。那我们再点击课程语音下边的这个内容呢,是如果我们的 云文本特别长的话,我们可以提前在这先切分,然后逐段的来输出,这样的效果会更好一些,如果特别长的话,反而效果会差一些, 这这已经生成,然后我们播放听一下,我们这里就输入响心合成的内容。文本切分工具,所以太长,建议先寝合成,会根据文本的换行分开合成,再拼起来。 怎么样?太神奇,太厉害了,太佩服了。呃,这,这就是这个工具的使用方法,这个工具呢,它其实特别简单,首先第一步呢,它是对 我们的音频素材做一些,呃,整理,然后第二步呢,在这我们输入这个模型的名字,输入这个文本的地址链链接, 这这两个文件夹就可以逐行的,这样一键三连就可以开始训练,然后到第二步就是训练这个微调这个模型,然后接下来我们就可以使用了,非常简单。 那这就是今天给大家介绍的内容,如果我的内容对你有帮助,欢迎大家订阅点赞评论,如果有任何问题可以在评论区留言,我会及时反馈,谢谢大家。
ai 声音克隆为半级教程, nice ai 孙燕姿爆火全网一颗人生单,现在外面定价三百块,学完这个视频你也可以轻松炼丹克隆人生。想要实现 ai 声音克隆,需要做以下的准备,首先第一点,咱们需要一段您自己的干净的语音内容, 就是你想克隆谁的声音,你必须有对应的语音作为基础的支撑,因为我平时经常录课和录短视频,所以说我这些资料还是非常的具备的。大家呢自己去找你要克隆的声音模板,比如说你要克隆一些其他的声音,这个时候大家记住大约三个小时左右的声音是最为合适的, 这样的话他能更好的帮助咱们把对应的声音刻拢出来,然后注意后缀呢,最好是 wav 模式,这样的话方便咱们切片和进行后续的读取好。准备好三段声音以后,咱们首先要做的就是把这个声音文件做一个切片处理, 因为现在咱们这个文件呢,有的都是一个小时课程的录制,所以说呢太大将来没办法进行声音的提取和声音的模仿,所以咱们现在呢打开咱们的音频切片工具,先把声音进行一个对应的切片分割, 在这咱们直接双击打开对应的工具,工具打开以后,咱们添加音频文件这五项选择打开,然后在这选择一个导书包, 咱们就导出到当前对应的位置上,咱们就叫 lg, 对吧?老张好,回车,然后选择文件,然后选择 star, 这样的话他会对咱们对应的内容进行分割,会把每一句话单独分成一个切片,大家稍等好,当出现这样的一个内容,证明咱们切片完成。 回到咱们的导书地方,大家可以看到咱们把原本的五个文件已经拆分成了一千一百零九个项目,每一句话就是一个单独的文件内容。好,现在咱们切分完成以后,就可以直接实现 声音克隆了,解压老张给大家准备的声音克隆压缩包解压完成以后,咱们双击进入,咱们可以看到作者已经帮咱们把对应的模型都已经写好了,只需要按顺序执行一二三四即可轻松完成。在这个地方呢,咱们首先找到 dataside 缸状这样的一个文件夹,把咱们刚才 切割好的音频文件剪切,直接放到对应的文件夹下方,然后他会自动的找到对应文件进行声音克隆的解析。 好,然后咱们选择第一项进行数据预处理,这个预处理的速度还是比较快的,大家只需要稍等几分钟,当出现按键继续时就可轻松取消。好的,当大家看到这样的一个画面呢,就证明咱们这个是完成的, 所以说咱们直接按键继续就可以跳出。 ok, 当第一项结束以后,就要进入到最磨人的第二项训练了,这个训练呢,双击打开之后呢,他会有一个对应的步数的一个叠带 啊,大家可以看一下老张这张图片啊,老张呢基本上是运行了大约有四个小时左右,迭代了一万六千八的一个步数啊,如果说你想效果更好呢,你就把你的电脑多开一点时间,这是根据你电脑的显存,如果电脑显存够好,他训练的速度就会很快,如果电脑显存一般呢,就多开一段时间 到这,大家注意啊,中途关闭没有任何问题,因为咱们这个电脑运行一段时间,你会发现它的温度会很高,尽量的关一关,让电脑稍微的歇一歇, 然后这个训练呢,到一定的步数,他是没完没了的,你直接给他手动关闭就可以。好,训练结束以后呢,咱们就可以直接进行第三步啊,双击打开他和第一步是一样的,咱们在运行到一定程度之后呢,也是会按键直接继续就可以了啊,这老张就不做演示了。 好,然后接下来呢,咱们如果说都已经训练完成以后,在进行第四步之前呢,兄弟们,咱们一定要按照要求, 先把这个 app 点 py 这个文件先做一步更改,咱们可以直接用您的记事本打开,或者如果你有编辑软件的话,可以直接双击直接打开对应的工具, 然后咱们找到这个 py 文件,就是咱们说的拍森文件。之后呢,注意这样的一个选项,就是 svc 这个位置,咱们这个地方咱们需要改一个数值,这个根据什么?根据你所训练的步数, 老张训练多少?是不是一万六千八百步,如果说您训练的更多,在这进行更改,这个在哪查看呢?大家看在对应的 logs 文件夹中,这有一个专门的部署文件,您按照这个方式填写进去,然后保存就可以了,就可以直接双击第四个相关按钮。好,当大家看到这样的一个画面,证明咱们的这个推理预测成功的启动了,启动完成以后,咱们只需要打开对应的这个网址。好的,大家可以看到,这个时候他会 练出一个专门的音色,就是老张是不是该咱们训练的那个声音呢?然后在这您要上传一段音频,上传音频,然后他给你进行更改。好的,大家可以看一下,这是老张呢重新导出的一个 wa 格式的相关内容,然后咱们就可以直接在这点击上传,把文件上传上来,咱们先听一下原文章, 这是一条价值两千的教学视频,外面一个人声单三百元定制好,然后咱们接下来参数,这是一条价值两千元的教,然后选择自动剪辑外面一颗人声单即可轻松完成。好的,大家可以看到啊,因为视频声音较短,所以说他很快就会完成,咱们来一起试听一下效果。 好的,这里是程雪老张定期分享互联网知识以及好用的软件推荐,希望大家多多关注。
哈喽,大家好,我是玄黎,欢迎收看我的视频,不过你可能感觉声音有点不太对,没错,这个声音是我用拉克斯的音频克隆出来的,并且只用了五秒的样本,我还可以换一个声音和你说话,比如,好,各位好,欢迎收看我的视频。本期视频可能和之前就一点点不一样, 现在听到的声音是使用最新的人工智能技术克隆船,并且它使用起来没有任何门槛,也不需要电脑配置。这可真是秦始皇吃花椒迎麻了呀。 下面我将在三分钟之内为你讲清楚如何只使用几秒的语音克隆一个人的声音。首先在浏览器打开我们需要用到的工具 ricoai, 他的首页已经有很多别人制作分享的角色了,点击播放能直接试听 一眼,钉针鉴定为瑞生克隆的,如果喜欢的话,可以把它添加到列表后边,可以直接使用这些 角色来生成语音。那么我们如何使用这些角色和自己创建角色呢?非常简单,首先点击右上角的创作中心,进入到后台,选择角色管理。点击添加角色, 他会有两种样本添加方式,一种是选择一个音频文件,另一种是直接录音,这个时候要尽量上传品质比较高的样本。如果是录音,尽量找一个比较安静的地方,如果是上传文件,也尽量避免有背景噪音和 bgm。 如果你想看拢一些博主或者影视角色的声音,可以把视频下载或者录屏下来,一般五到二十秒就可以,最重要的是声音的质量,而不是长度。 但是因为这些视频都会添加一些 bgm, 所以直接上传可能效果不太好。我们可以使用开源的 automate vocal remover 工具,它可以一键去除掉视频内的 bgm, 直流下人声,并输入成音频格式到 ketap 上,把它获取下来,然后 select input, 选择视频或者音频文件。 select output, 选择输出目录两个模型,按我视频中的选即可。然后勾上 vocals only, 点击下边的 start processing, 稍微等待一下,我们就得到一个干净的人声音频了。我们来开箱一个非常不一样的二次元周边。我们来开箱一个非常不一样的二次元周边。把音频上传到 rei 口 ai, 他就会自动创建完成角色,然后我们点击语音生成,先选择一个角色, 然后输入你想要转换的文本,如果是比较长的句子,可以在下边按段落添加。最后点击开始生成,一般只需要几秒你就能得到一段音频。哈喽,大家好,我是旋律,欢迎收看我的视频。 鲜衣怒马少年郎,谁人务实李唐王。可以直接把他下载下来, 或者进行一些其他的操作。大部分情况下,上面的操作就已经能够生成比较像的声音了,但是如果你感觉生成效果不太完美的话,可以多生成几次。 如果还是不满意,可以在生成之前先进行一些调整,主要是多样性和稳定性两个参数。多样性可以先设置为一百,然后再次生成。如果还是感觉不完美,那就改成九十九这样依次递减, 达到最好的效果。稳定性一般不消动,需要改的话,也可以先设置成一百,然后每次减十往下调整,直到找到最完美的平衡点。 哈喽,大家好,我是旋离,欢迎收看我的视频。根据我的测试,一般五到八秒的声音样本就能有一个很好的效果,最短的情况下只需要两秒声音就能克隆的比较像。而传统的 vits 登记术一般都需要长达数分钟或者数小时的样本才能有比较好的效果。根据我的一些 了解,这主要是两者在底层原理上的不同。 vits 等传统的克隆技术主要是通过大量的样本来制作模型,然后生成一段程序化表达的声音,再使用模型来赋予声音音色、音调、韵律。 而蕊儿口 ai 则是通过大量的语音训练,让 ai 真正理解了文本和声音的对应关系,变成了一个类似赛博声优的角色。就像现实中的声优可以模仿各种声线一样,他也可以直接用丰富的经验非常自然的把声音给模仿出来。很多时候他甚至能够理解文本中的情绪,并做出相应的表达,要更加贴近真实的人类。 视频点赞越来越难了,哪里难了,不要睁着眼睛乱说好不好?这么多年大家看视频都是点赞的,我真的要疯掉了。所以他只需要极短的样本,创建角色和上传声音的时候也基本上不怎么用,等几秒钟就能完成。如果上传一些如唱歌之类 有旋律的音频,那创建出来的角色甚至也会自己横唱, 这种方式也是我认为更加领先,更加有净化空间的。不过由于他目前刚诞生不久,所以并非完美,但在基础版本就已经有如此好的效果,在未来会有巨大的提升可能性。 最后就是很多人关心的是否能白飘的问题,在首次登录的时候,他会给两千点数到点数商店,每日签到会给六九九,每个汉字转换只需要一点,已经能够转换很多内容了, 基本上约等于百票。好了,以上就是本期视频的全部内容,如果你也感兴趣的话,可以给我点一个免费的赞和收藏,我是学历九九,我们下期再见吧!
语音克隆相信很多人都听说过吧啊,就是可以把你或者别人的声音克隆下来,随时变成自己想说的话。就是 marking bird, 他是 gat 上面的开源项目,现在呢,网上有很多已经编译好的版本啊,不用搭建环境,直接就可以用双击运行,打开之后是这 这个界面,点这个 bros 按钮,可以把录制好的声音文件直接导入,必须是 wav 格式,也可以点这个 record 啊,他可以实时录音,我这里录一下我的声音。这个母猪生产后啊,首先要给母猪进行消毒,给母猪和猪仔一个干净温暖的环。 录好之后呢,然后右边稳稳框里输入想说的文字,点这个按钮合成,再点右边这个输出音频,就可以听到克隆后的效果了。世界上最遥远的距离 不是天涯海角,而是我站在你面前,却看不见你的容颜。床前明月光,疑是地上霜。举头望明月,低头思故乡。我是你爸爸, 你是我儿。效果不好的话可以切换这里选一个编码器,一共就三个啊,随便选。我是你爸爸,你是我儿子 我是你爸爸,你是我儿子。如果想重复听的话,点这个 replay 啊,可以重复收听,如果觉得效果还不错啊,想要导出来可以点这个 east pod。 这个我试了几遍啊,声音确实是有些相似,但是效果一般啊,主要还得看声音和录制环境,有的声音啊,克隆出来就很像,比如他自带的样本啊,出来的效果就很好, 控制单元发送一个读命令,然后我们,我是你爸爸,你是我儿子。反正这个工具吧,适合娱乐,开开玩笑什么的啊,也不能太当真,毕竟目前的效果还是非常有限的。
人生克隆离线版本期视频推荐一款声音复制及替换工具,不需要联网,转换速度取决硬件。我们先看一段原版的网络演讲素材,那些想从我们身上看到中国未来的人,亲爱的父母、师长前辈, 其实我还不知道想成为什么样的人。接下来是替换后男生发音,那些想从我们身上看到中国未来的人,亲爱的父母,师长前辈, 其实我还不知道想成为什么样的人。接下来上教程。软件下载后先进行解压,然后按提示把对应的模型库放到指定文件目录,接下来开始操作,我们双击萨尔这个命令提示服务右 测试系统默认浏览器可以提前打开,接下来等待模型库的加载,这里需要几分钟就直接跳过了,看到右侧浏览器自动打开服务窗口,表示加载成功了。窗口画面设置比较简洁,这里可以选择语言, 这里默认速度即可。这里有系统内置的真人发声音频,这里可以选择文字转声音及声音转声音两种模式,这里选择需要修改的音频文件, 文件选择后系统会自动将音频文件转换成袜格式。这里的默认人声可以自定义,可以从本地上传自己的录音等等。如果电脑有话筒,可以点击右侧现场录音,录音后 选择使用。最后点击下面这个,立即开始生成,接下来等待完成即可。转换的重点就是保证录音或音频文件发音清晰,不要有背景等嘈杂声音。 转换完成后,这里可以进行试听。点击这里可以保存到指定目录, 感兴趣的小伙伴可以关注、点赞、收藏,有疑问可评论区留言,这样能帮助更多的人关注。树人说每天都在进步,下期再见! nice!
大家好,今天给大家分享一款开源免费的音频克隆软件,下面我来演示一下。首先双击打开软件,好,打开了,今天要给大家介绍的就是这款 tpt sorrys 音频克隆软件,下面这三种也是音频克隆软件,但是效果最好的是第一种。 我们首先来准备一下带训练的音频文件,我们使用其他工具的伴奏人声分离功能,将提前准备的一个 音频文件进行处理,这是我之前的一个视频作品的片段,我准备了一分钟的这个视频来看一下。大家好,今天给大家分享一款。好, 然后我们设置一下带分离音频的目录 模型,使用第一种就可以了,点击开始提取,我们来看一下进度,好,分离完成,我们打开输出目录,然后选择这个人声所在的目录复制一下,然后我们回到音频分割这里 设置一下在切割的音频,然后这些设置使用默认的就可以了,点击开始切割 好,切割完成,我们打开输出目录,复制一下这个音频素材所在的目录,然后我们再回到 tvt sovic 这里,设置一下带训练音频的目录, 然后自定义模型,使用一个自定义的名称语音识别模型,我们可以选 大一点,这样准确率更高一点,从上到下模型一直变大,准确率也一直变高。有一次演示,我使用第一个最小的模型就可以了,训练轮数使用默认的十五轮 就可以,有很好的效果,等于是演示这里使用五轮 p 处理大小,我们使用默认的四就可以了。然后我们依次点击一二三四五 进行操作。第一步,音频渠道点击这一步会有点问题,这应该是这个软件的一个 bug 啊,接下来我将会告诉大家怎么处理这个问题。好,我们可以看到报错了, 这里提示的是打开这个音频文件失败了,不错了,我们来对比一下,先找到这个音频 文件所在的文件夹,在这个软件的目录下搜索这个文件夹,然后找到这个路径, 我们可以发现一个问题,那就是这个地方的路径比这个地方的路径少了一个点位五,也就是说这些文件夹的那个名字都要把这个点位五给去掉。接下来我使用 p 处理工具来对这个 文件夹的名字进行批量的替换,把这个点位五去掉,变成这个样子,我们点击重命名距离, 好,处理了,我们再来看一下,现在就变成和这个报错提示这个路径一致了。我们重新进行音频渠道点击, 我们可以发现这次已经成功了,然后提示进行第二步,我们点击音频打标,好,打标完成,提示我们进行第三步,然后点击第三步,好,第三步也完成了,好进行第四步, 由于第四步和第五步比较耗时,我就直接跳过了,然后我们直接看我事先训练的一个结果,这两步训练会分别产生一个模型文件,这个会产生 所谓词的模型文件,也是这个模型文件,这个训练会产生这个模 gbt 的模型文件。好,接下来我使用这两个模型文件来进行文字转音频的操作。呃,我们首先选择 gbt 的模型,是一五,代表的是第五轮产生的一个模型, 如果说我们设置的是十五人,他会一直产生五人,十人,十五人三个模型文件,我这里直接选择模型文件,然后 sovic 也选择默写文件,然后参考音频,选择我们之前切割的一个音频文件,随便选择一个,我们选择第二个吧。然后我们来听一下第二个 批量下载工具,之前给大家分享过两款,然后将对应的文本填在这个地方。好,我们设置好以后,其他的 使用默认的设置就可以了。然后我们点击开始生成音频,我们看一下进度。好,生成成功,我们打开生成目录来听一下。 你的每一天都充满阳光,每一刻都充满欢笑,愿你的努力得到回报,愿你的梦想早已实现。这个声音看到的效果还是很不错的,音色和那个原始的音频 是差不多的,这是只是在我训练只有五轮的情况下就这个效果,如果训练人数增多,效果应该会更好,有兴趣的朋友可以自己尝试一下。好,今天就分享到这里,谢谢大家。
前后对比啊,我们这个女生依然还没有听,我们先听一下控制单元发送一个读命令,然后我们去根据这个地址找到这个地址对应的这个存储单元。好,我们记住这个女生说话是这个样子的,我们现在合成的这段话,我们来听一下, 世界上最遥远的距离不是天涯海角,而是我站在你面前却看不见你的容颜。哈喽,大家好,本期视频呢是关于如何去克隆别人的声音啊,只需要获取到这个人三到十秒的一个声音样本,就可以让他学出任意我们说想让他说的话,那么呃,这个工具的话仅适用于教育目的啊, 首先我们需要获取到呢这个文件,那么文件的获取地址呢?在这个网站里面啊,三 w 点七及二零二二点四幺零,那么点开这个网站之后呢,我们点击免费专区,进入免费专区之后呢,我们往下滑啊,可以看到这里是什么客人别的声音,我们点击下载啊,在这个下载这个网站里面啊,下载 最后呢,我们将它挤压到当前文件夹,挤压密码也在网站里面吧。 好的,解压完成之后呢,我们双击打开文件展,那这个呃项目呢,你可以在网站里面获取到,也可以在给他号码里面取获取到, 那打开之后呢,我们可以看到啊,这里有几个文件,零一一二三啊,那么零一二三呢?这是个文件,需要根据你自己电脑的一个情况啊,去安装这个运行库和依赖包,那坐在这边是已经安装好了,我们直接运行就可以了,你如果说没有安装的话是运行不起来的,所以你自己要提前去安装好 好的,安装完成之后呢, 打开应该是这个样子,那么首先我们需要输入一段我们自己说想要让他说的音频,那我们点击这个按钮,在这里往下滑,有一个测试音频啊,这里也可以穿入你自己的音频,我们点击女生衣。 好,这里呢就已经开始识别到这个女生衣的他的一个音色了啊,那么在这上面呢,是他的一个模型啊,模型这里呢就是一个默认的三个模型,但有更多模型的话可以写作者,我们默认就可以了,然后选择点击啊,当然这里只是要先让他说出的话啊,这段是要他说出的话,我们就不去做更改了,当然你也可以让他去说出你自己想要跟他说的话。我们点击这个按钮。 好,点击这个按钮说,我们可以多点几次啊,但也可以多点几次。好,然后呢,我们可以点击这里,我们来听一听,看一下他的前后对比啊,我们这个女生依然还没有听,我们先听一下控制单元发送一个读命令,然后我们去根据这个地址,找到这个地址对应的这个存储单元。好,我们记住这个女生说话是这个样子的,我们现在合成的这段, 我们来听一下。世界上最遥远的距离不是天涯海角,而是我站在你面前却看不见你的容颜。好,可以看到啊,这里面模型不同啊,因为,呃,因为我们世界上是有很多语言的,包括男女方言,对吧?所以这个模型的话可以根据自己的需求去更改,比如我们选择第二个,我们再合成一次, 然后我们来听一下 世界上最遥远的距离不是天涯海角,而是我站在你面前却看不见你的容颜。好的, 那么大概的一个,呃,流程就是这个样子啊,就是我们首先需要点击按钮呢去传入我们上要那说的啊,一个声音样本,然后呢通过声音样本去选择模型,再去点击生成,生成之后呢,我们就可以刚才去播放出来我们说想要他说的话这段话。 好,那么呃本次的视频呢就到这里,有需要的话可以前往这个网站里面进行去获取啊,奇迹二零二二点四万。哦,好,那本期视频就到这里。
听说只要十秒钟就可以克隆自己的声音,这是真的吗?是真的,你可以去看看我的这个视频。那么要是我想克隆别人的声音呢?你有办法吗?是朋友啊, 如果是朋友的话,你可以让他按照剪映提供的文字照着念,然后你对着麦克风播放就可以。那要是不是朋友呢?比如克隆那个叫不飞烟的,你还有办法吗?这个嘛,就要解决两个卡脖子的问题哦。 哪两个问题呢?第一个麻烦就是你得让对方按照剪映给出的图片上的文字朗读出来,并且把他的音频交给你。这个有什么难的,不是有 gpt 骚费斯吗?这个可能 难不倒我。第二个卡脖子的问题是什么呢?剪映只接受麦克风输入,所以我们得想个办法 把电脑播放的声音转化为麦克风输入。难道开启立体声混音功能也不可以吗?之前可以,不过立体声混音有噪点,效果欠佳。而且 剪映了最近一次更新后好像不太行了。那就没有其他办法了吗?虽然花了我不少时间, 但是最后我找到了解决办法。哈哈,那你倒是快点告诉我呀。告诉你 你点赞了吗?你一剑三连了吗?又想白折吗?好嘛好嘛,这就给你一剑三连呢。哈哈哈,现在总可以说了吧。哈哈, 好说好说,马上教你怎么操作。打开剪映,点击开始创作,点击文本, 单击朗读,点击这个加号登录 qq, 按下 ctrl alt 加 a, 把文字截图,点击文字识别, 点击复制按钮,打开新记事本,并按 control 加 v 粘贴。 打开 gpt soviets 所在的文件夹,双击 go web ui, 看到黑色命令行窗口,耐心等待,直到自动弹出网页,看到这个网页 就可以后续操作了。单击这个,单击这个,单击这个。选 g p t 模型,选 service 模型,打勾, 看到这个提示,耐心等待,直到自动打开一个新网页,看到这个网页就可以后续操作了。 找一个你中意的音频切片,如果你看到这里有点懵,可以去看我这个视频,有详细教程。拖入到这里, 打开语音标记的 list 文件,打开一个新的记事本,把 list 文件拖进来,复制与 与前面语音相对应的文字,切换到网页粘贴到这里, 听一下核对文字内容,确保语音与文字内容一致。夫人,兄弟,我此番只为劫财。 切换到前面的记事本,复制这段文字,切换到网页粘贴到这里。单击合成语音, 点击三个点点选择下载,打开下载文件夹, 打开文件听一下。猫在光线暗的时候会放大眼睛的瞳孔,这样 打开这个 virtual audio cable 官网这个软件的作用就是把喇叭的声音信号通过这个软件进行转化,转变成系统的麦克风声音信号输入, 单击这里可以前往下载页面,单击这个就开始下载安装包了,下载后安装,然后重启电脑,来到右下角喇叭图标右键选择,打开声音设置,点击声音控制面板,单击 line 设为默认值 切换到录音,单击 line 设为默认值。点击确定到这里你有两个选择,一是直接跳到七分三十二秒处观看声音录入,一是跟着我一起用 au 对声音进行优化。打开 iu, 来到菜单编辑首选项,音频硬件默认输入,选择无输入, 默认输出,选择 line, 确定,把前面 g p t soviet 生成的语音拖入到 a u。 从波纹线可以看出生成的语音有瑕疵, 一是相位有问题,二是音量太小。然后你可以用 au 自带的功能进行调整。为了拓展大家的思路,我用 rx 来演示调整的过程。来到效果,单击 vst 三, 选择 r x connect 连接,选择 repair 修复,点击 apply 应用,看到 r x x 界面出现,来到右侧,找到 face, 这个就是向位调整,注意看波纹线的前后变化,你就明白什么是向位了,说上千百遍,不如你亲眼一见。点击向位打勾, 点击渲染,这是项位调整后的状态,声音波纹线与中心线上下对称,原先的音量太小了,我们接下来调整音量,点击标准化默认调整到负一分贝,单击渲染, 单击返回,看到这个弹窗,不要乱点。切换到 a u, 来到效果,单击 v s t 三,选择 r x connect 连接,点击应用。你看看这调整后的音频是不是 更完美了呢?切换到 r x, 直接关闭它。 把播放头拖页到末尾,来到菜单编辑插入,选择静音,设置插入静音的时长,比如两秒,两百毫秒,点击 ok。 把播放头拖页到最开始,切换到剪映,点击开始录制,切换到 au, 按下空格开始播放声音,然后在光线暗的时候会放大眼睛的瞳孔, 这样他们就能在夜晚看的更清楚,这是他们适应黑暗环境的一种方式。声音播放结束后,按下空格,切换到剪映,单击暂停。看到这个提示公, 恭喜你翻车了。单击重新录制来到这里,选择 line, 切换到 au, 把播放头拖页到最开始,切换到剪映,点击开始录制, 切换到 au, 按下空格开始播放声音。猫在光线暗的时候会放大眼睛的瞳孔, 这样他们就能在夜晚看的更清楚,这是他们适应黑暗环境的一种方式。声音播放结束后,按下空格,切换到剪映,单击暂停。看到这个界面,恭喜你,你成功了。点击耳机图标试听一下,这是你的专属克隆音色,希望你能喜欢。 this is your clone voice, hope you like it。 起个名字,点击保存音色,生成的音色就保存在这里,它保存在剪映云服务器上,可以跨多端同时使用重装软件依然存在。随便输入一段文字,单击字幕, 切换到朗读,点击开始朗读 唾液播放头到起点,听听效果。地球的大气层就像一层隐形保护膜,它不仅为我们提供了氧气, 还阻挡了来自太阳的有害辐射。跟 gpt sovic 相比,剪映的克隆声音有诸多优点。如果你觉得这个视频对你有帮助,欢迎点赞,咱们下期再见!
三秒钟的时间, ai 就能完美克隆出任何人的声音。 i believe that's more korea, what's enough of the tosei。 这款工具还带有文字转语音的功能,并且你还可以轻松制作出你的专属声音模型。可能很多人都听过 ai 声音克隆,但大多数的教程对新手都不够友好,还需要部署复杂的运行环境。 那么废话不多说,今天给大家分享一款小白也能轻松上手的 a 声音克隆工具。 we 这款工具暂时只支持中文、英文和日文的声音克隆。软件的压缩包我已经打包好了,有需要的私信我就可以了。然后我们把软件下载下来之后, 点击单击鼠标右键进行解压,解压到当前文件夹。解压完成之后,我们直接双击这个程序,刚打开软件的时候,他会有一个检查模型的过程,一般也就几十秒的时间,之后就会自动打开我们的外部 ui 界面。第一个选项是图 通过音频文件将文本转换成语音,第二个选项是上传一段音频文件,然后训练成模型的。软件的使用非常简单,我们直接来到第三个选项,这个是通过我们训练的声音模型,把文本转换成语音,在这里我输入需要转换的文本, 这里选择中文,口音也选择中文,当然你也可以选择不需要。接着下面是发音人,这款工具内置了几款声音,我在这里选择这一个给大家听一下效果。点击生成按钮之后,软件就开始自动合成语音了,合成好了给大家听一下效果。大家好,我是老猫, 和真人说话的差别不大,还带有语音情感的效果,在这里输入我们需要转换的文本,下面选择一下语言,然后上传一段钢铁侠的声音, i believe that's north korea, 这里是我们所上传应聘的文本 内容,在这里软件会自动识别我们上传的音频,然后把它转换为文字,这里是对我们上传语音命名的,我们随便填写一下,然后点击生成按钮,软件就会根据我们所上传的声音,把我们输入的文本进行一个转换。语音合成好了给大家听一下效果。 我是钢铁侠,感谢大家的观看,和这人说话的效果是一样的,如果不告诉你哪个是转换出来的声音的话,我们只听声音是很难分辨出来的。然后我们把上传的声音制作成模型, 点击上面的第二个选项,把音频给上传上来,只需要三秒钟的音频就可以训练出模型。音频上传之后,我们点击制作按钮, 模型就生成好了,我们点击这里,可以直接把模型给下载下来,然后来到用模型生成语音的界面,选择我们刚才训练好的模型,输入文本,然后点击生成按钮,好了 给大家听下效果。我是钢铁侠,感谢大家的观看,合成的效果还是很完美的。最后一个选项是生成长语音的功能,这些功能都非常简单,由于时间的关系,我就录制这么多,如果感觉视频对你有所帮助的话,别忘记支持一下。
只需要把自己的声音上传这个 ar 工具呢,就能给我们克隆出自己的声音,而且你还根本听不出来区别。这个软件呢就牛了啊,学会了任何声音都可以复制,但是呢,不是傻瓜式的, 需要熟练应用软件。不过呢,你也不用担心啊,我把工具和教程呢都整理好了,想要体验的兄弟们可以评论回复,声音在置顶评论区一键获取。
夫人兄弟,我此番只为劫财,今天介绍目前最强人生克隆的人工智能。 大家好,今天给大家介绍一款克隆声音的软件,免费开源,只要你提供一分钟的声音素材就可以完美克隆声音,然后你只需要输入文字就能得到用克隆声音朗读的音频文件。 如果你是电脑小白,也不懂编程,只要你跟着本视频来操作,绝对没有问题。本视频一共分为六个部分,下面演示 python 的下载并安装,打开这个网页,下拉来到底部,这里有各种版本提供下载,以六十四位 windows 为例,单击这个下载链接,单击保留, 单击打开文件夹,双击准备安装 python, 点击运行,这两项都要勾选上,单击 这里开始安装。打开资源管理器,来到此电脑,右键单击选择属性,单击高级系统设置,单击环境变量,来到系统变量这里找到 pass, 来到左下角,单击开始输入 python, 找到 python 三点一零,右键单击打开文件位置,右键单击打开文件所在的位置,单击地址栏高亮后按 control 加 c 复制文件加地址,切换到环境变量对话框,选中 path, 单击编辑, 单击新建,按 control 加 we 粘贴,切换到 python 安装目录,双击 script, 来到地址栏,单击 control 加 c 复制文件加地址,再单击新建,按 control 加 we 粘贴,单击确定 单击确定,单击确定。接下来安装 gpt soviet, 打开这个网页,如果你无法打开这个网址,我为你准备了网盘下载,下拉 找到 environment preparation, 单击这个链接开始下载整合包, 打开文件夹, control 加 c 复制压缩包打开你要运行 gpt service 的目录。 control 加 v 粘贴解压缩 得到这个文件夹。双击打开文件夹,双击 goyb 启动程序,然后你会看到自动弹出的命令行窗口,这个命令行窗口在程序运行期间千万不要关闭它。耐心等待直到自动弹出一个网页。当你看 到这个网页时,程序加载完成。接下来我们所有的操作都在网页中进行。当你的声音素材需要去除背景音乐或音效的时候,勾选 u v 二五 web u i。 这是一个人生分离的模块,耐心等待直到弹出一个新网页。 如果声音素材很干净,只有人声,可以跳过这一步。当你看到这个网页的时候,就可以进行人声分离了。这个文本框可以粘贴上文件夹地址。人声分离模块将会批量处理这个文件夹内部的所有声音素材。如果要处理单个声音文件, 选中声音文件,左键将它拖延到这个方框里。来到模型,单击,选择去除声音的模型,这里有各种模型的简介,你可以看看说明,如果觉得麻烦,你就选第一个模型就行。这里是人声和背景音分离后的存放位置,不想折腾的话,选择默认位置就好。单击 wave 格式,设置人声分离 后的文件格式,然后单击转换按钮,看到这个标志,这是在处理当中。这里有数字,可以了解到处理的进度。 当你看到这个输出信息时,处理结束,并且成功打开存放文件夹。以 instrument 为前缀的是背景声,以 vocal 为前缀的是人声,这是我们需要的,我们只对人声文件做后续处理,当你看到输出信息时,一大串文字说明处理已经结束。 恭喜你,你失败了,你有三种选择,一是换一个模型重新处理一遍。二是使用纯净的人声,比如用手机或麦克风录制自己的声音,或是去看我这个视频, 教你如何获得明星大腕的干净人生。三是使用其他人生分离的手段,比如在线人生分离网站,我推荐这个人生分离网站,免费, 干净便捷,无广告。处理完后关闭这个网页,同时取消勾选。这里粘贴分离出人生的音频文件或文件夹,单击地址栏, ctrl c 复制,单击文本框, ctrl 加 v 粘贴, 这里设置音频分割后的存放文件加位置,我这里使用默认值,这个值用来设定切割文件后的声音长度值,小声音短值大声音长。最后得到的每个声音片段最好不要超过十秒。参数设置好后,单击开始语音切歌, 当看到切割结束,处理就完成了。声音切割片段存放的位置在这里。 output 下的 slicer 下划线 up 文件夹,双击打开 slicer 下划线 up 文件夹,打开 addition 二零二四,这个步骤小白可以跳过。检查一 下所有音频片段的长度框,选所有切片,拖入 addition 项目面板,这个 duration 就是每个片段的声音长度,从上到下检查所有片段,确保不要超过十秒, ok, 都没有问题。关闭 au, 切换到网页,在这个文本框输入声音切片的文件加地址, 打开切片所在的文件夹,单击地址栏, ctrl 加 c 粘贴到这里, ctrl 加 v 单机开启批量 asr 按钮,这个过程是识别声音内容并生成对应的文字。当你看到这个文字的时候,别急,还在处理中。 当你看到这个提示的时候,声音转文字完成。这个文件存放在哪里呢?在 asr 下划线 up 文件夹下这个 slicer 下划线 up to list 文件,不是字幕文件。用记事本打开这个文件。语音文本标注文件由四部分构成,一是声音切片的完整路径。二是声音切片所在的文件夹。三是声音的语言,比如中文。哦,对了,目前音色的输入只支持中文。四是声音识别出来的文字, 你可以理解为字幕。了解这个文件的构成之后,以后,当你有了每句话的人物声音及其他对应的文字内容,你就可以跳过之前的所有步骤, 自己用记事本制作这个文件,然后直接进行后续操作。在这个文本框中输入语音文本标注文件的路径,选中 slicer 下划线 uplist 这个文件,按 control 加 c 复制, 单击地址栏,按 ctrl 加 v 粘贴,选择双引号内部的内容,按 ctrl 加 x 剪切,切换到网页,按 ctrl 加 v 粘贴,在这里勾选, 耐心等待,直到自动弹出新网页,这就是语音文本。对照标注的网页,左侧是识别出来的文字内容,右边是对应的声音。 接下来的任务就是听声音。修改左侧的文字识别中的错误内容,同时删除文字内容中的非中文字符,比如说英文。 如果当前页已经校对,修改完毕之后,你可以进入下一页继续校对。注意,如果每页有修改,在单击 next index 进入到下一页之前,要先点击 submit text 保存已经修改的内容,接下来我来演示一遍,单击播放键听声音。 夫人兄弟,我此番只为劫财。根据听到的内容对文字内容进行校正修改,如果没有问题就交对下一句, 全部句子教对完之后,单击 safel, 关闭网页,这里取消勾选。 单击这个标签,在这里输入新模型的名字,比如 john wen。 打开标注文件, slicer, 下划线 uplist 所在的文件夹,选中文件,按 control 加 c 复制,来到地址栏,按 control 加 v 粘贴,选择双引号内部的内容, 按 control 加 x 剪切切换到网页,在这个文本框按 control 加 v 粘贴,这里输入声音切割片段所在的文件夹,来到资源管理器,打开 slicer, 下划线 up 文件夹,来到地址栏,单击按 control 加 c 复制, 来到网页,在这里粘贴上,单击开启一键三连按钮,看到这个提示时,说明已经正常开始训练模型了, 当你看到这个提示时,训练结束。来到顶部单机微调训练标签,这个地方的数值跟你的显卡的显存相关,显卡显存大调高点,显存小调低点。在这里可以看到你的显卡型号,我的显卡一千六百六十卡六 g 的显存,所以用默认值三就好了。 这个值控制训练的轮数,默认训练八轮,这个值控制训练多少轮就保存一次模型,现在是四,也就是说每训练四轮就会保存一次模型,前面设置的总数是八轮,所以你将得到两个 sovid 模型, 这些参数是控制 g、 p、 t 训练的参数。同上面一样,这个地方的数值跟显卡的显存相关,这个值控制训练的轮数,默认训练十五轮,这个值控制训练多少轮就保存一次模型,单击这个按钮,就开始 solve 训练了。 当看到这个提示时,说明正在训练中,耐心等待,这个时间比较长,如果你想知道具体进度,可以打开命令行窗口,在这里可以看到进度。当你看到 app 一代表第一轮模型训练好了。 当你看到 ipad 七代表第七轮模型训练好了。刚才设置一共八轮 soviet 训练,就剩最后一轮了。最小画面另行窗口,不是关闭哈。回到网页界面, 当看到这个提示时, soviet 训练就完成了。如果你想查看 soviet 训练的结果文件,打开资源管理器,双击这个文件夹,就是这两个文件,注意他们的后缀。 e, 四代表训练了四轮的模型 s 幺二八代表一百二十八步。八十八代 代表训练了八轮的模型 s 二五六代表二百五十六步。最小化文件加窗口,单击这个按钮,就开始 gpt 训练了。看到这个提示时,说明正在训练中,同 soviet 训练一样,可以打开命令行窗口,查看具体进度。 当你看到这个提示时, gpt 训练就完成了。最小画面另行窗口,不是关闭哈。回到网页界面,打开资源管理器,双击 gpt with 文件夹,可以看到有三个模型,一五代表训练了五轮的模型,一十代表训练了十轮的模型,一十五代表训练了十五轮的模型。 最小化文件夹窗口。来到网页中部,单击 e c 推理标签大会第一项来到这里,单击这个按钮,刷新一下模型,单击下拉按钮,在下拉列表中已经能看到我们刚 刚才训练的 gpt 模型了。随意选择一个 gpt 模型,再选择一个 sovid 模型,单击勾选它。耐心等待, 当看到这个网页时,就可以开始文本转语音了。来到文件夹窗口,找到声音切割片段的文件夹,选一个比较好的声音片段,拖页到这里,在这里输入声音切片,对应的文字内容也可以从标注文件中复制。 在这里输入你想要变成声音的文字内容, 然后单击合成语音按钮, 单机播放键听声音。今天介绍目前最强人生克隆的人工智能, 只需要训练一分钟,单击三个点点,单击下载就可以保存得到的音频文件了。单击打开文件夹,就可以打开文件保存的位置。除了朗读中文,只要在这里输入英文克隆的声音,就会用英语朗读。 单击合成语音按钮,点击播放键。 today is very cold, it is snowing outside。 还可以朗读日语,只要在这里输入日文, 还没听姜文说日文呢?来听听。 如果想朗读长文本,这里给出了三种断句的方式,我们就以中文句号来断句吧。随便选择一大段文字,给美剧的末尾加上句号,选中并复制粘贴到文本框中。单击 按中文句号切对长文本进行断句全选并复制粘贴到这里。选择语言如中文,然后单击合成语音 播放来听听效果。今天跟大家分享哪里可以下载到高清蓝光电影?如何下载,最后介绍如何分离蓝光电影部门,你感觉怎么样? 今天的分享就到这里,下期再见!
我们今天说一下这个声音克隆工具,也就是文本转语音工具,就是这个 marking board, 它号称五秒钟内就可以克隆你的声音,然后就可以进行文本转语音,先开演示,这是文本转语音效果测试工具,现在播放的是合成后的语音, 这是文本转语音效果测试工具,现在播放的是合成后的语音,这是文本转语音效果测试工具。讲一下具体这个安装步骤,首先安装拍摄,打开拍摄官网链接,然后点击这里下载,选择 windows 系统,然后这个版本, 我们选择这个三点一零点一,一选择这个六四位,然后下载下来。下载下来之后呢,我们双击运行安装它,安装的时候要注意 勾选这个,将拍摄加入到环境变量,然后就点击这个滤镜安装就可以了,下面都是全能默认移动安装就可以。拍摄,安装完成之后,我们安装这个拍 touch, 打开他的链接, 在这里你是什么系统,你选择哪一个?然后如果你是英文达显卡的话,可以选这个,如果你是其他显卡的话,你可以就选这个 cpu。 选择好选项之后呢,我们复制这个命令,然后按住键盘上的 windows 加二键,输入 cmd, 然后回车,然后在鼠标右键粘贴刚才这个命令, 然后回车安装。安装完成之后呢,我们再配置这个 ffm peg, 首先打开它这个下载链接,点击这个选择这个温度系统,然后点击这个链接,然后点击这个把它下载下来。下载下来 之后呢,我们用鼠标右键,然后解压到当前文件夹,然后打开这个文件夹,打开这个 brn 文件夹,点击复制这个路径地址,我们鼠标右键点击此电脑,选择属性,点击这个高级系统设置, 点击环境变量,点击这个 pos, 点击编辑,点击新建,然后粘贴刚才那个路径地址,然后点击确定就可以,然后全都确定, 确定,然后关闭它。我们按键盘上的 windows 加二键,打开,输入 cmd 后,输入这个命令,验证一下是否安装成功了。 fm pg, 你这个他输出了这个版本信息之后呢,就说明你已经成功安装了,关闭他, 可以我们再下载安装这个,再下载这个程序,他这个有两个版本,一个是这个主版本,还有一个这个零点零一版本, 他这个零点一版本得有两年多时间没有更新了,我看了,你看都是两年以前的,他不知道,可能应该不维护了吧。这个版本我们选择这个主版本,我们点击这个代码这个按钮,点击下载他将这个代码下载下来, 把这个压缩包下载下来之后,右击解压到当前文件夹,然后打开这个文件夹,然后找到这个文件,点 tst 文件这个打开它,找到里面有这个 选项,这个你这个值,你就不要改到其他了,你直接把这个等号后面这些内容全部都删掉, 然后保存,关闭这个,然后我们再去安装它,在这个文件夹下面点击这个地址栏,输入 cmd 回车,然后我们用复制这个命令,这安装命令,复制他,鼠标右键点击,然后粘贴,然后回车,然后就安装他。安装完成之后呢,我们再安装这个命令,复制他,鼠标右键点击,然后粘贴回车。安装,安装完成之后呢, 我们下面就是准备模型,这里有作者给提供了四个模型,下面三个模型是在 零点零点一版本里面使用的,我们你可以选择这个七十五 k 这个第一个模型,这个有网盘链接下载,你可以点击网盘,然后把这个模型下载下来。模型下载下 下来之后呢,放到这个 deta 这个文件夹,然后点开这个,在这个文件夹里面新建一个这个文件夹,它本来是没有的,你要手动去建一个这个文件夹,然后打,然后打开它, 将这个模型放进来,我们就可以启动这个 wifi 界面,输入这个命令,我复制它, 在这个终端里面,鼠标右键点击粘贴,然后回车,他这给你提示了地址,你复制他,然后到浏览器地址栏里面打开就可以, 这里面输入带转换成音频的文本,这里面是选择那个模型,我们选择这个七十五 k 这个模型,你选择其他模型的话,他会提示错误,因为我们现在用的是这个主版本,不是零点零一 版本,我们选择这七十五 k, 然后点击合成,然后他这很快就合成完成了,你点击播放就可以,也可以点击这个下载。如果你想更换其他的声音的话,你可以点击这个上传一小段其他的声音, 这里面只支持 wav 格式的,点击他打开,然后你再去点击这个合成,他这里面的声音就会换了另一种声音了,欢迎使用, 现已支持。注意你选择这个声音时长不能太长,我试了一下,感觉五秒钟之内效果会更好一点, 如果你时间太长的话,他转换出来的声音哈会可能有很长的,要么空白,要么很长的杂音,没有人在说话那种,最好就是说短一点,五秒钟以内吧,你可以自己测试一下。 如果你想启动这个应用程序界面的话,在这里面操作的话,可以复制这个命令,然后点击这个文件夹,在地址栏里面输入 cd 回车,鼠标右键点击粘贴,然后回车,他就可以启动这个应用程序界面了。 你这里的话选择音频的话,他就可以选择 mp 三格式了,他不仅仅是 wa, 像在这里操作的时候,他只能选择 wa, 我们这里可以选择其他格式的音频, 随便随便选一个,好吧。然后在这里模型,我们选择七十五 k 这个,然后在这里输入带合成语音的文本文本内容,然后点击这合成, 欢迎使用工具箱现已支持中文输入。然后合成完之后之后呢,你就可以点击这个导出,按 将这个文件命名一个名字,然后点击保存,就可以将这个合成后的声音保存下来了。你要想再换其他声音呢,就点击这个选择其他的声音 就可以了,再去输入文本内容去转换。这个软件他上手有一定的难度,他不光安装起来麻烦,他使用起来也不是那么简单, 他不像我讲的上一个一张图跨年软件,这个软件他安装起来也很麻烦,但是他使用起来就极其的简单,但是这个软件呢,他对新手小白来说 是,嗯,略微有点难的。如果你有这方面的需求,比如说你喜欢研究这些软件,或是做一些配音啊、解说啊,你可以去仔细研究一下,如果你用的不太多的话,你其实也 可以有其他一些选择。我之前也讲过一些其他的克隆声音的软件,这个软件你要是想用的话,得去花大量时间去研究一下,因为这个软件确实有些复杂。好了,大家有兴趣的话可以去试一试吧。