粉丝8807获赞4.6万
好的,欢迎来到我的频道,今天我们来做一个 rbc 炼丹的一个教程啊,就是模型训练的一个教程啊,然后我们先点开这个,先点开这个模型训练,然后这边我还是五幺四的版本,然后在这边啊,这个那个 应该看得到吧。哦,然后我们这边点击试练,然后这边有实验名,实验名的话就输入你想要的模型的名字就可以了啊,我比如说一二三,然后 采用,我采用的话我这边比较推荐四十 k。 四十八 k 也可以吧,看按你按你喜欢的来吧, 反正这两个差距倒是没有那么大。我感觉反正我就选了四十四十 k, 然后这边就是正面意思,然后这边目前训练还是唯一的,我没有更新最新的那个,最新 新的那个版本好像可以训练 vr 的,然后我们这边随便拿一段这个音频,就是你要复制他的文件夹啊,才是文件夹路径,注意文件夹路径,然后这边就全部默认就好了,然后这边下面保存频率一般调到二十,然后人数的话,因为我这边是教程啊, 就不训练太多了,我一般来说是五百呢。然后如果喜欢这个声音的话,可以去我的爱发店啊,我已经在爱发店里面上架了,就是我现在说话这个声音,然后这边每张显卡的这个就是显唇断釉啊,简单的意思就是 可以看一下我这边十 g 啊,然后我这边给个十 g 都可以,如果你给到二十就是我是三七八零吗?我给到二十其实也可以,但是他只会按照你这个内存的最大来算多的意思吧,就是你拉的就算四十顶天, 那也就死, ok, 不好意思。然后一般来说的话死就够了,稍微牛一点,不然的话,呃,显卡怎么说呢?就是你炼丹把这个丹炉给他烧坏了就不太好了。 好,然后这边最新保存这个文件,我一般选择四啊,就是保留最新的就可以了,不然的话他是很大啊,这个很大,然后调整完这些以后,直接点击一键试炼就可以了。但是有个问题,一键试炼以后,如果你的, 如果你的这个这个 add 开头的这个文件没有生成,这个是训练特征的,所以文件就是如果这个文件没有生成的话,你点一下生成,然后就可以了。 好,我们这边全流程来一遍,就是点击处理数据,我一遍一遍来,不用一键处理。好吧?然后他就会处理一些数据,然后我们就可以看到 这边 cpu 开始泡,然后这个 logs, 这个文件夹里面会创建命名的这个实验名的一个文件夹,就会创建这每个文件夹,然后,呃,这个处理数据就会帮你把这些音频全部拆分掉,然后这边是体育特征,但是这个啊,不对, 就是这个啊,来去提取一些啊,音源里面的一些特征,以及些音频里面的一些音频 名还是改成。然后如果你们训练的话,可以按照五百轮来,但是也不用非得五百呢。 呃,一般来说两百到五百之间都是没什么问题的,但是,呃,如果你调的很大的话,其实也不好,比如说你调个一千,这就拉满了,对吧?但这样的话其实也不是很好,音频的话会过你和就是。 是啊,简单来说就是把那些杂音什么的也会全部合进去,就是取一个中间的整个五百会比较好一些啊,当然这些认知属于我目前的一个, 如果有在这方面了解的更详细的大佬可以在评论区帮我补充一下啊,感谢谢谢。 ok, 然后这边 也提取特征了,然后训练模型就可以了,然后训练模型的时候,这个这个指令窗会弹个训练的步数,就是轮数训练的人数,这边是五百的,我等会训练一般给他暂停掉。我这边设置错了,然后这边的话就是命名转换的这个 指令窗,你使用这些个外部 ui 还有这个语音转换,你都不能关这个指令窗啊,这个指令窗关了以后这个就失效了,这个就失效。然后还有一个问题啊,就是一些 啊,只有补充的一些问题,就是经常在群里面问的,就是在 qq 里面为什么发语音会有那种滋滋的电流声啊?因为 qq 它的采样率不是那么高啊,不像库卡啊这种专业的语音频道,这么 这个产量率可以这么大啊。然后一般来说推荐把这个,这个不是你的麦克风输入员吗?对于 qq 来说是你的声源的输入员吗?你可以把这个调成四四幺零零赫兹,然后 可以了,然后你大退 qq, 然后重新登录就可以了,就可以听到干净的一个声音了,就没有那种电流的吱吱声。然后可能还要注意一下设置里面啊,设置里面云通话这边要改一下,改成这个,改成这个,然后这边的话已经在跑了,可以看到这是一轮二轮, 我现在排才跑到二轮,反正跑完的话就是没有问题,跑完的话这边就会显示哦,比如说我这边是五百,他就会显示五百,然后就可以了。好的,然后我们退出吧,我这边直接把这个后台关了,然后这里就没有了。嗯, ok, 然后啊,这边其实是个多余的啊,我反正没有生成完,我就给他删掉了,完大概其实就这么多啊,我炼丹的话他还是一个比较玄学的一个东西,不可能说你一次性就能炼出一个很好的一个模型哦,还是需要一些并齐了,并齐成分在里面。 本期视频就到这里,如果喜欢的话请一键三连,我们下期再见,拜拜。 ok, ok, 忘记了我补录一段啊,就是模型,就是训练完的模型文件在这个文件夹里, w e i 这个我把就在这个文件夹里,然后刚刚是一二三,这边就会生成一二三点 p t h 文件。
hello, 大家好,这里是奇肯科技,我是小奇,今天给大家带来关于这款 rvc 变身网软件的详细使用教程,那么下面就跟着我的操作一起来学习吧。第一步,打开 rvc 变身官网 三 w 点 r v c b s 点 com, 选择一种下载方式,点击立即下载,下载完成后 再打开安装包,木正安装即可。再次说明一点, 由于软件安装包接近二点四 g 的大小,所以不管呢是下载还是安装可能都需要一定的时间,请大家耐心的等待。 第一步,安装完成之后,我们先不要急着打开储存器,而是先安装 r v c 变声集成声卡的专用驱动,找到 r v c 变声网安装路径下的 r v c q d, 也就是这个,点击安装启动即可。安装完成后关闭。第三步,打开 r v c 变声驱动程序,并选择输出的 a e 通道为电脑集成声卡的默认延伸器,注意是 w d n 开头的这个通道。 第四步,打开 r v c 变身丸组成器, 设置 r v c 的输入和输出,输入为麦克翁集成声卡麦克风,输出为变身启动 v 字开头的,选择好之后点击确定。 第五步,找到自己喜欢的 r v c 模型,并选择加载, 注意第一次加载的时间可能会稍微慢一点,大家呢需要等待一下。第六步, r v c 变身驱动面板说明,左侧记忆是控制 mac 文的延伸, 这个位置是控制我们这个 r v c 变身的通道,左侧的这个 a 我们是控制延伸的今天, b 是控制延伸的输出, 这个 a 是是控制变身的今天这个 b, 这个 b 是控制变身的 输出,变身的输出,如果我们只需要变身的话,只需要变身的话,只前面这两只,前面这两个关掉就可以了。 如果说我们只需要延伸,把前面两个打开,把前面两个打开,把变声关掉啊,这样就可以,这里呢是控制我们今天的音量,这里是控制输出的音量。 第七步,电脑声音面板的设置 播换设备,我们选择电脑自带的延伸器设备录制这里我们选择 则变声驱动的通道。第八步,设置直播软件的通道,我们以 yy 语音为例,打开 语音软件的设置,选择高级音频设置。麦克文,这里选择变声通道。 v 字开头的延伸器则选择我们电脑自带的延伸器设备。点击确定 rvc 变声器的所有设置。讲解到此结束,如果说还有不明白的可以联系我们的 qq 二五四五七九四六零, 本次教程结束,感谢你的观看。 播换设备,我们选择电脑自带的延伸器设备录制,这里我们选择变声驱动的通道。 第八步,设置直播软件的通道,我们以 y y 语音为例,打开 语音软件的设置,选择高级音频设置。麦克文,这里选择变声通道。 v 字开头的延伸器则选择我们电脑自带的延 升级设备。点击切电 r、 v、 c 变声器的所有设置。 讲解到此结束,如果说还有不明白的可以联系我们的 qq 二五四五七九四六零,本次教程结束,感谢你的观看。
喂喂喂,可以听到吗?今天统一回答一下 i v c 变声效果的调试问题吧,虽然我有写在群文件里,但是问的人还是蛮多的, 全当做一个补充吧。开始前呢,我们先定义一下本视频所说的变身效果是指的哪些方面。第一,变身干净无噪音。第二,真实扮演你的音色,第三才是音色好听。至于为什么这样排序,我会在后面给出我的解释。 关于变声质量的参数,我总结了以下几点,第一,电脑要带的动。什么叫做带的动?就是你在开游戏或者直播等软件的同时, lvc 采用,选在你能接受的位置监听变声效果,不出现卡顿和机关 枪等问题,就是带的动,这是最主要的,你要是电脑都带不动,效果什么的就别谈了。如果电脑带不动还特别想用的话,建议还是走云端运行,不过你可能要有点知识储备, 不然你可能教学也看不懂。第二,环境要安静,同时麦克风收音干净,无明显电流。 我们刚才也说了,变声效果第一点就是干净无杂音,不管是键盘声还是其他物体的碰撞声,都尽量不要有,如果无法避免,就只能去开降噪喽, 但是你得清楚,所有的降噪都会降低你最终的效果。第三,模型无明显底造。有些朋友不清楚模型是怎么来的, 在这里简单说一下,就比如你们想练自己的音色模型,可以自己录制自己的该声素材, 想用来聊天就录说话素材,想唱歌就录清唱素材。录制好的素材呢,用 rvc 自带的工具可以去训练,最后会出来 pth 文件和 index 文件,这两个文件决定你的变声音色,也就是所谓的模型。 但是模型也分干净和不干净,你的录音环境如果不好,也没有降噪处理, 声音不干净,有杂音或者有混响,那模型的最终效果也会有明显的杂音。底噪,模型裂臀后无明显底噪,咬字清晰干净,那么他就是把好模型。 第四参数调整。在这里我把日版和花老版本一起说一下,都是差不多的内容,没啥效果上的区别。首先看红色的框框 音调参数,男变女音调拉高十二左右,就我个人而言,范围一般选在九到十六之间,偏九是御姐音,偏十六就是夹子音, 再拉勾大概率就是小黄人了。男变男或者女变女音调基本上不用动零左右,浮动一二就可以,女变男则相反,拉低十二的音调, 不过男模型由于没什么市场,练单师都很少练。接着看黑色框框, index 比率 一般不用开,拉零就行。如果非要讲的话,我打个比方,就好比一个人要写作文,小时候需要查字典, index 就可以,相当于字典,请看紫色圈圈的地方。从 pm 到 rmv, pe 高音算法一路升级, 现在最好用的算法是按 mvp, 相当于已经有了语文基础,不需要查字典,写作文呢,开了反而会影响效率,质量提升很少。 所以我们算法上无脑血,怕 mvpe, index 直接拉零就可以了。接着我们来看橙色的框框采样参数,虽然日版和花老版本参数不同,但是在这里都 都是一样的,拉低采样,降低延迟,同时提高电脑负载,如果电脑带不动,会出现卡顿或者类似机关枪突突突的问题, 所以这个要根据电脑性能和同时开启的软件来决定拉到多少合适。最后看粉色的框框推理参数,在这里日本和花老板们可能有些许区别,不过大体是一样的, 拉高可以提高咬字的准确度,增加电脑占用。日版这个一般选三万多或者六万多的就行,花老版本带入弹出拉满,额外推里拉到一点五以上就行,其他没有圈出来的表示不重要,可以不做调整。 第五,说话语气这点其实很重要,你可以先给自己一个人设调整音调,接近说话的声音,然后用调整语气和吐字的方式去扮演你所唤醒的角色。比如你想扮演一个知性御姐, 可以把音调调整到十或者十一,然后呢,尽可能把每个字的尾音咬清楚, 说话不急不缓,轻松自然。再比如,你要扮演懒洋洋, 那么就有先选择懒羊羊的模型,然后根据自己的声键调整音调,接着去想象一下懒羊羊说话的语气和用词, 大概就是这个样子,或者类似于这样的声音。这两个年轻人显然是有备而来,我刚一同意他,他一下就站起来了,很快啊,然后他一个左正蹬,一个右边腿,一个左刺拳, 我全都放出去了,他突然偷袭左磁拳打我脸啊,我大意了,没有闪,他左拳给我右眼蹭了一下。 这两个年轻人不讲武德来骗来偷袭我这个六十九岁的老同志。 我劝这位年轻人好自为之,好好反思。经过如少讲解,相信大家对 rvc 变相参数有了一定的了解, 那么我们回到开始,因为 r v c 对声音调整比较大,所以各类杂音在经过转换后会非常奇怪。想要变声效果清晰真实,至少要保证环境安静,收音干净,模型五体造这三条, 然后真实扮演你的音色,也就是去找配音演员一样的感觉,去模仿你想象的人设,质疑口音方言什么的完全不用在意, 语速、语调和咬字对于真实感才是至关重要的,有可能你的口音在一部分人耳朵里恰好是点睛之笔。最后,如果你所选模型的音色也恰好是你想要试验的,那么恭喜 稀泥,这对于你来说就是最好的模型,毕竟萝卜白菜各有所爱,世上哪有那么多天籁之音,在我看来,变声的真实感远比好听要优先级更高。 以上是我个人浅薄理解,如果恰好对你有帮助,请点个赞分享给更多的人,杠精勿喷,就是这样喽,拜拜!
哎,喂喂喂,听得到吗?我今天录一期 r v c 的全流程使用。嗯,先看一下,第一步呢,就是先把这个软件下一下,我们现在下一台软件这些东西都能在群里边找到啊。 那么我们现在下载完了,下载完之后打开 这个就不用解压,可以直接打开然后安装。 哎,好的,我们把这个虚拟声卡安装完之后重启一下电脑,这个电脑我已经刚才重启过了,重启之后呢,我们看这个声音控制面板这个地方呢就会有这个 虚拟声卡这个选项。哎,就这个样子,然后把它给设置成默认就行了,我们现在不用管,他想可以打开的话可以在这个地方。嗯,这个这个打开不了的话,我们右键,然后找到这个 位置,找到位置的话,这个这个给他放到桌面上,然后发送到快捷方式。 ok, 放在这里, 然后我们打开它,这个简单版的话就是这样很清楚。嗯,第一列呢, 这个不用管, delete 呢就是,嗯,我们的选择这个输入,然后这个呢就是我们虚拟 你声卡,然后这个输出的话可以选尽量都选这个 mme 吧,有的这个 wdm 可能用不了。好,这个界面我们熟悉之后可以看下一个,我们把这个日版的这个 rvc 这次演示用这个日版的,然后这个给解压一下,解压完之后就是这个样子,就是这个,然后打开最底下,然后启动这个小日字版本,然后也可以发送到桌面快捷方式。然后就是这个 我们把它打开,打开之后呢,应该是这个界面,我们点击 r v c, 点击开始,然后这个 界面会加载一会命令窗口呢,是不能关的,我们给它缩小。这里是我们的模型,你们刚开始应该是没有这么多模型的,都可以去群里面下载,这些都是免费用的, 我们选择编辑好,我们加载一个模型,随便选一个吧。嗯, 把这个 p t h 文件选择, 这个是 index 文件选择好我们上传。 哎,等他这边加载完之后,我们点关闭,所以我们现在这个就 能用了啊。这一块区域还有这个采样,这一块是比较简单的,你们可以直接按照我的设置。嗯,音调 调到十二,这个 index 指数调到零点三, 输出采样,这个按照自己电脑配置来,我群里会放一个意图流,你们按照自己的音色和配置。嗯,适当的调整一下就行了。 我们主要说一说新手最难理解的地方就是音频设备这一块,当时我也是看了许多大佬的视频,然后搞明白了。 首先是输入设备,我们选择电脑自带的这个麦克风,也就是我们常用的, 如果你有自己的麦克风的话,可能会有其他的选项,我这个是笔记本电脑自带,然后是输出输出,好多朋友不理解啊,哎,为啥他不是自带的扬声器,自带的扬声器或者是其他什么的。 看过我上一个视频的朋友可能就注意到了,没看过的立刻现在马上去点赞,然后回来在上一个视频,我全程都录了本音,为的是展示本音和变声之后的差别,而且还有自带的延迟问题,那么我当时是怎么设置的呢? 对喽,我直接选择电脑自带的这个扬声器,也就是这一个并没有通过 with meter 这个虚拟声卡,就是这两个的区别。 那么我们在日常的使用中呢,一定是选择这个 voicemeter 的,你选择这个虚拟声卡之后呢,会把这边变声器的声音转入到这个虚拟声卡的这个中转这部分, 那么 a 类呢?是耳反, b 类就相当于输出给对方听。接下来呢,我们需要把 这个中转里面的声音发送到其他的软件里面,在声音面控制面板里面,我们可以把这个维斯米特给设置成默认。 qq 呢,这个比较特殊,这个地方设置的其实是 qq 电话,也就是说两个人相互说话打电话的那个功能, 然后这个地方如果不设置成默认的话,你的 qq 语音,也就说你单独给对方说话 发的 qq 语音,他是不会变声的,所以你想要变声,这个地方需要设置成默认。同理游戏的通话设置也是一样的,这里我们以英雄联盟举例,点击设置 语音,找到 whismetter 这个虚拟声卡,然后可以在这里点击测试,我开一个变声器试一下。 喂,喂,哎,这个就是刚才我选择的这个,就是刚才我选择的这个模型, 这可能跟我不太匹配这可能跟我不太匹配,到时候你们可以自己调更合适,你们可以自己调更合适的。最后我发音的声音,然后大概在 总结一下,喂,可以听到吗?最后呢,我再做一个总结,首先是下载在群里面都有,然后是安卓 rvc 和 vc meter, 打开 vc meter, 然后打开 rvc, rvc 的设置, 到时候可以看这个意图流,然后把转换过的声音输入到 qq 或者游戏就可以了。嗯,就是这样,拜拜。
哈喽,晚上好,这里是 kiki 今天做一期视频,讲一下 r v c 的基本参数设置。 其实 rvc 发展了大半年了,我以为这么基础的东西大家应该都懂了,但是其实从我接触的小伙伴来看,还是很多人对面板参数理解不够。 kk 经常要同样的问题回答好几遍,那今天我索性就来讲一下。话不多说,我们直接开始 首先响应预知,五脑负六十就可以了,他相当于一个门线,如果你往右边拉了,那么低于这个音量的数值,他声音就进不来。为了我们声音的完整,我们要把这个门完整的打开。 音调设置从左到右,声音越来越细,男变女加十二左右调整,女变男减十二左右调整, 男变男和女变女零附近左右调整即可。 index rate, 它的作用在于拉了它,你出来,声音会去模仿训练级的说话语气,也就是原素材,但是对于大多数人来说,没有听过原素材是否接近根本感觉不出来。 另一方面,拉了 index, 哪怕就一点点,资源占用都会提升非常多,所以一般我们使用保持零即可。 响度因子零,这边就是你说话的音量一,就是模型的音量。一零零六版本加入的这个新功能其实非常牛, et 的建议是选择零点八五到零点九,这样可以让你的声音增加一点起伏的同时能够过滤掉某些模型自带的底噪, 大家可以试一下。采用长度,我们可以理解成每次变身的时间单元,时间越久效果越好,但延迟越高 也越是资源,我们需要在颜值和效果之间找一个平衡点。 kk, 现在三零六零的显卡常用零点三,如果你显卡更好或者采用双卡方案,可以拿到更低试试。这里补充一下,就是算法延迟加推理时间,那加起来就等于你的实际颜值。 哈维斯的进程数现在几乎没有意义,因为我们现在都在用 r m v p e 算法,不需要哈维斯来提取,音高一般拉一就可以了。 弹幕弹出相当于一个说话的残影,长度短,声音清脆但不连贯,拉长说话更丝滑,但太长会口胡。如果你觉得人家用某个模型已经很好了,但是你自己口胡了, 请检查一下弹幕弹出这里是不是拉满了。一般零点零四到零点零八之间,自己找找感觉吧。额外 推理时长,它本身不增加延迟,但是也不能太短。按照之前跟方群说法,采样长度加额外推理要大于二,但是我们实测大于三的时候,第一个字会口呼,所以建议二到三之间。 至于树木和树树降噪,只能说条件允许,尽量不用吧,除非你不介意它吞字。好了, r v c 基本参数就介绍到这里,如果有帮助到你的话,记得给 kiki 一个三连哦。