粉丝294获赞625
哈喽,大家好,我是摄影师幻,今天要给大家讲解的是电商人如何了解 sd 的图身图功能。纹身图我已经讲过了,就开始讲图身图,如果纹身图还不了解的,可以去看我上一期李诗词大模型,微艺这一栏,都是一样的,我们就不管了, 这里也是一样的,除了这俩,出现了一个 clip 反推和 debro 反推,两个都是反推,那么他们有什么区别呢?就是 clip 更类似于一个句子, d pro 的话就更类似于一些词组或者是单词。接下来看到这一块我期待的图深图功能,唯一的图深图就是你可以点一下这里,你可以把图片拖到这里, 或者是点点一下这里,选择你的这个框上传。比如说我上传一下这个土生土,我觉得相当于 me journey 的 电图吧。比如说你传了一张之后,你加一些描述词,比如说一个瓶子在绿色的桌布上,餐刀车厘子,尽悟风光 自然光,金屋摄影八 k 杰作高质量,我们把我们的提示词放在这里,然后反向提示词,我就直接一个低质量了,宽高比我们选择一样的哈,这一块我上一期也讲过,大家可以去看一下, 然后这边多了一个重绘幅度,是他肯定是对你这张图片在进行加工,就是这个加工的重性吧,你可以理解为加工的严重性。日常的范围的话是零点六到零点八之间会比较正常, 比如说我选个零点七五呀,或者这样之类的。如果你越想象你的这个图片呢,你重回幅度就低一点,想让他发挥出自己的风格呢,就越高一点。嗯,这些我们先比, 别管我,我之后会会总想,因为这个脚本这一块的话还是比较难的,我们先把这两个基础的功能学一下,然后我们生产一下,试一下,大家就可以看到这张图。首先是有原图的成分在里面,因为我电图了这个瓶子的大致轮廓,这些水果的摆放呀,都很像, 但是呢,我根据我的提示词又做了一些变化,比如说这个红色的果子,他有点像小番茄,但是我说要车厘子,要餐刀,他就是餐刀摆放在这里,绿色的桌布,我应该说墨绿色可能会更那个一点, 再加上零点七五的重绘幅度,让他有一些自己的想象力,如果我想更像的话,我就可以更低一点,但我觉得就还好。我们在看到这个涂鸦重绘,我先写了一下我大概想画的这个东西,一个女模特,绿色头发,白皮 皮肤,蓝色裙子,背景是红色玫瑰做的墙壁,杰作八 k 摄影时尚,对,就画的挺好看的。 vr 这个功能啊,加一些正面提示词,我反面提示词是低质量对待,不说是采样方式,这个 就是宽高比,我直接点一下这个,他会同步这个东西,你可以多画几张重回复,都是零点七五你就画出来了,我觉得可能没有画的好看,但是我也不是特别介意就还行,虽然和我的画工比可能是低一点, 但是可以忍受。但是涂鸦我们不是很经常用,因为他会改变你整体的画面,比如说改变我们的产品或者是什么,那就没有什么太大的意义。比如说我这张我就上传了这个图片,这个是蒙版,白色的就是蒙版区域,黑色的就是 蒙版区。我说一瓶香水在一个复古的桌上,背景是华丽的宫殿,一些质量的提示词,我选的是仅调整大小之类的东西,可以看一下我的参数,我重回幅度调的比较高,是零点九二,因为我觉得这一步需要画的比较多,我就深沉了一些。 当然你可以不断的调整你这个东西在画面中的比例,比如说把这个东西调小一点,因为我这个是产品的特写,所以他会很近这个也显得这个东西很大,和画面的比例不符,你可以调整一下 这个电商有时候可以用这个来换背景。下面我们看到批量处理输入目录你可以定一个目录,输出目录你可以定一个目录,但是所有的目录里面必须全都是英文,你批量重绘的目录,就比如说你想给这个输入目录, 对皮,零一加零一蒙版,零二加零二蒙版,他们的名字一定要对的上,还可以加 ctrl net, 这个我后期会讲到下面的参数,你们都可以选批量处理,注意注意,一定不能有中文,一定要全英文,包括你的电脑名称都不能叫电脑, 要交 computer。 这个图深图我们大概就讲到这里了,下一节应该会给大家讲一些总体的这个脚本怎么使用,脚本就是妥妥的效率神器,大家可以期待一下,如果感觉这一期对你有帮助,记得点赞、收藏加关注,我们下期再见!
哈喽,同学们,我是旭 sir, 这节课给大家讲一下 stable diffusion 图声图的一个基础操作。 图声图的逻辑其实跟文声图都是类似的,都是需要基于我们的文字提示语去生成图片,相比于文声图的话,他是多了一些图片的一些基础操作的功能,可以基于一张图片进行修改,通过点击上面这个图声图,他就可以切换到图声图整个这个模块里。 那我们看一下这个页面,其实他跟纹身图的一个差异也没有那么大,他只是多了一个图声图这个上传图片的一个这么大的一个模块, 这里有几个操作,第一个是图升图,第二个是绘图。当我切换这两个操作的时候,发现下面的数据其实并没有发生太大的变化,第一个是多了一个缩放模式,这里边有一些操作可以修改。那第二个呢,是多了一个重绘幅度, 那这个参数呢,也是我们可以进行调整的,那这些我们一会会给大家讲,那如果点击第三个局部重绘的话,那这里面的参数变化会大一些啊,比如说蒙版模糊、蒙版模式等等关于蒙版的一些设置,这三个局部重绘的一些界面基本上也都是类似的,只不过在一些功能上有一些细微的差异。 最后一个批量处理,这个比较好理解,就是选择多张照片,然后进行统一的批量的处理。 ok, 那接下来我们看一下图声图第一个这个模块的一个基础操作, 首先我们需要选择一张图片,把它弄进来,把图片拖进来的方式有几种,第一种呢就是点击上传啊,点击这里边我们可以去上传一张图片,同时我也可以在其他的平台,比如说这个 c 站里边,我把这张图片直接哎选择拖进来,拖进到这个模块里,他就会自动把这张图片上 传进来。比如说在文生图里面,我们给好关键词提示语,然后去生成一张图片, 生成之后呢,我们就可以在这张图片的下面看到一个图生图的一个按钮,点击这个图生图,他也会把这张图片以及图片的信息啊自动的填充到这个图生图这一个模块里。 第三种方法就是在图片信息里面,当我们把一张图片拖到图片信息这个模块里之后,他右边就会展示对应的这张图片的信息。下面呢也有一个图生图的按钮,点击这个图生图,他也会自动的把这张图片以及这张图片的信息自动填充到图生图这个模块里边。 ok, 然后我们再看一下这个下面的一些操作,这里面有一个缩放模式,缩放模式里下面有拉伸、裁切、填充以及直 直接缩放四个操作。这个缩放模式他可以结合这个画面的宽度和高度进行调整。比如说我这里面调整一下他画面的宽度,在视图里就会出现一个红色的框,那这个红框呢,就是决定我们生成的这个画面的一个宽度,比如说我们大概 把它调成一个这样的一个宽度,然后下面的重绘幅度我们把它调高一些。这个重绘幅度指的是新生成的图片,他跟原始的图片的一个匹配度, 比如说我们把这个数值调的越高,他生成的结果可能就更加偏离于这个我原始的这张图片。那如果说我把这个参数调的很低的话,那生成的这张图片他还会更加接近于原始的那张图片。 ok, 那我先把这个参数调高一点点啊,比如说调到零点七左右, 然后我点击生成图片,我们看一下, ok, 这就是生成的结果。生成的这张图片的宽度相比于原始的图片啊,他就变窄了一些,这是因为我们刚才改了宽度的这个参数, 那如果说我们把这个重绘幅度给他数值调小呢?因为我们现在看到的这张图片基本上没有造成太大的一些拉伸的图片变形的一些效果,这是因为我们刚才把这个参数调大了,如果说把它调小,他会变成什么样的?我们看一下,比如把它调成零点零六、零点零七吧,我们看一下 点击生成。哎,我们再看一下这张图,这张图他生成的一个效果基本上和我原图是非常接近的,但是他在宽度上进行了一个压缩,这就是因为我把重绘幅度给调低了。重绘幅度参数调低,他的 带来的一个结果就是他生成图片更接近于我原始图片,但是我已经更改了这里的一个缩放模式,他还会把这个宽度进行缩减,所以他就会造成这张图片进行了一些拉伸变形的一些这样的效果。 ok, 那这就是拉伸给我们带来的一个效果。我们看一下第二个裁剪,点击裁剪之后,我们也可以拖动一下这里面的一个宽度,假如说我们拖动到这个一个宽度吧,然后我们再把它高度也改一下, 高度是控制上下的一个啊这个高度的比例的,比如说我们改成这样,我们再去点击生成一下, ok, 他就会生成我刚才裁剪的那一个部分的局部的模块,这就是裁剪带来的一个功能。然后我们再点击一下填充,我们看 一下,然后把这个高度重新恢复一下,然后呢我们把这个宽度啊给他改宽一点,就是改到这么宽,然后我们再点击生成看一下, 然后这张图片呢,相比于原图,他左右就会变宽很多,但是变宽之后呢, ai 并没有把左右两边的这些内容给填充进去,他只是进行了一个拉伸处理,这个效果很显然不是我们想要的,那我们怎么办呢?可以把重绘幅度适当的调高, 重绘幅度调高之后呢,他就会自动把左右两边拉伸的这个部分给填充一些信息,填充一些图形的内容啊,给他填充进去。但是同时他人物可能也会发生一些比较大的一些变化,比如说我们改成零点六吧,然后再去点击生成, ok, 我们看一下他两边基本上就给我填充的还不错。然后但是人物呢,相比于刚才的那张图,其实他的变化还是有一些的,那这张图其实相对来讲控制的还好, 生成之后呢,这两边多出来的一些内容就给我自动的填充进去了,但是人物呢,也稍微发生了一些微微的变化,这就是填充这个命令。最后一个是直接缩放,直接缩放其实跟拉伸有一些类似,我们调整这个尺寸之后呢?呃,这个参数可以再适当的小一点, 然后我们再点击一下生成,他其实也是把这张图片进行了一些拉伸,其实这功能我们并不常用,最常用的还是前三个拉伸、裁剪以及填充,记住这三个功能就好了。然后下面的这个参数刚才给大家讲了,就是 不会幅度。这里再给大家强调一遍,这个参数呢,我们调的越高啊,那基本上他生成的这个图片就更加偏离于我们原始的这张图片, 如果参数调的更低呢,那生成的这张图片他会更加接近于我们原始的那张图片。这个重绘幅度呢,他会影响到这里边的采样迭代步数,因为当前这个采样迭代步数是二十八,我把它调的高一点吧,比如说调到四十,然后呢这里边的参数我调到零点五, 这样好算一些,他是怎么计算的呢?如果说采样迭代步数是四十的话,那生成的这张图片他应该是大概跑四十步,那如果说我把重绘幅度调成零点五的话,那就是四十的一半,那就是大概跑二十步左右,二十到二十一步,那我现在按照这个 参数,我去点击一下生成,然后点击,然后把这个控制台给打开,看一下这里的参数,哎,还是二十二十一,那这个参数其实就是刚才我改了这里边这个四十和零点五这两个参数造成的那个结果他就跑了二十步左右,就是这样的一个概念。 下面这里有一个随机种子,这个种子是什么意思呢?我们对应生成的这张图片,每一张图片他都有一个种子值,就像下面这个信息里面就包含了一个 c 的值啊,四幺八八等等等等。这个 c 的值呢,就类似于这张图片的一个身份证的一个号码,每一张图片他都有一个 c 的值。 举例子,如果说我们使用同样的种子值,并且使用同样的正向描述语以及负向描述语,那按照道理来讲,生成的图片应该是完全一模一样的,这就 是种子值的一个概念。那种子值右边还有两个小按钮,一个是骰子,点击一下,这个骰子呢,他前面的数值会变成负一,这个负一表示生成的图片就是一个随机的种子,他可能是任何一张图片的一个风格。 那后面这个按钮呢?点击一下,他会恢复到原来我上一张生成图片的那个种子时,那点击之后呢,他就会自动变成刚才上一张就是四幺八八等等等等这个参数。 接下来我们看一下绘图的功能,呃,这里我选择一张啊,存好的一张白色的图片 啊,什么都没有。切换到绘图功能之后呢,右上角有两个操作,一个是画笔,这里我们可以调整画笔的大小,画笔的粗细,然后另外一个呢是画笔的颜色,我们可以随便改一个颜色,比如说改一个蓝色吧。那还有一种方式呢,就比如说我在网 上找的一张图片,还以这张图片为例吧,我把这张图片继续拖到这个绘图的这个面板里边,拖进来之后呢,我们看一下这个人的头发,这个人的头发的侧边呢,稍微有一些稀疏,那我们希望把这个人的头发侧边啊变得浓密一些,那么可以怎么办呢? 把这个画笔啊调的再稍微粗一点点,然后把这个颜色呢改成一个纯黑啊,或者直接吸一下这个人物的头发的颜色也 ok, 稍微偏棕色一些啊, 吸一下这个胡子吧,稍微偏紫色一些, ok 的。然后把这画笔再调大一点,然后把这个位置,把他头发的这个位置给他描一下, 希望他更加浓密一些,哎,大概画到这个位置,然后呢,我们可以把这关键词也复制过来, 然后反向关键词也复制过来,然后我们再去点击生成,看一下它的效果。 哎,这出错了啊,这个是因为我这边的一些参数没有变,我们把这个参数啊调整到他的实际的画幅的大小,大概是 五幺二吧,五幺二七六八, ok, 五幺二乘以七六八。采用方法,然后我们选择这个比较常用的这个关键词,我们再补一个吧,补一个 blackpire dla ck, 然后把这个重绘幅度参数稍微调大一点点,调到零点六左右,然后点击生成,我们再看一下。 哎,把这个图片放大一点,哎,现在这张图呢,他侧边的这个毛发,就相比于我们之前刚才拖进来这张图片,他的毛发就要浓厚了很多啊,这个也是绘图的一个功能的一个用法。
今天教电商人了解 sd 的纹身图,我大概会把它尽可能的讲的简单,会分几个板块来讲,大模型提示词这一块良方法,这一块脚本我打算放到下一期讲,因为这个东西比较复杂,内容量也比较多。哈喽,大家好,我是摄影师,幻 这些就是擅长画电商类的大模型,他们的后缀一般都是这种 saftensa, 有的也有 c kpt。 装路径的话上一期已经跟大家讲过了。首先是大模型,大家可以把大模型理解为一个风格型的画家,比如说梵高,他就很擅长向日葵这种类型的油画。 那我上期给大家的几个模型就是擅长化现代的商业风格的东西,再放到文件夹里就行,一定要重启这个外部 ui, 重启了之后还没有显示的话,点击 这个刷新他就会更新一下。然后还有一个东西叫做 v a e, windows 版本的 v a e 直接在后面,麦克版本的 v a e 的话,可能在这个设置 stable diffusion, 然后这个模型的 v a e 里面选择一下。我选择的是这个 的话,你可以把它理解为一个滤镜,比如说你用你用手机拍美食,他可能拍出来灰灰的,但是你加了一个滤镜之后,他立刻变得好看了起来,他是管饱和度、灰度呀、色彩呀这些的, 他的后置一般是 p t k p t 啊, saftensis 啊都有,最常用的是这个,我上期已经给大家分享了,大家可以存一下。下面我们看到提示词板块,提示词也叫 promote, 这边分两个框,这边是正向提示词,就是你想要什么,你就在这个框里写什么反向提示 词,就是你不想要什么,你就在框里写什么,提示词的书写呢,它是有思维的,你写出来一个词,它叫做 tag。 提示词的框架一般是主体,比如说你的主体是一瓶香水, 你就说这个再加主体特征,这个香水是红色的,再加场景香水放在桌上,再加场景特征,香水放在一个木质的桌上。深沉的视角,比如说 相机的正面啊,侧面,或者是广角镜头呀,或者是或者是长焦镜头呀,再加上风格, 你就比如说当然这个风格他的数据库里应该是只有知名的那种艺术家的风格,你就比如说像那种国际的摄影大师,或者是那种什么哥特风格产品摄影风格,或者是那种 studio light 影棚灯光 这种东西呢,能够更接近我们需要的那种摄影类型的产品。最后我们可以加上我们的画质,比如说什么四 k, 嗯, high quality 就是高质量呀, masterpiece 啊杰作,因为 ai 搜集数据的时候,他可能数据库里面有高质量的 图片,也有低质量的图片,那么你就要清楚的告诉他,你需要高质量的图片这一块,他又会把高质量的这一块作为这个素材生成给你。下面给大家分享一些骑手式,就是高质量的骑手式, 这里输入你想要的正面提示词,比如说我直接在一个翻译软件上打,一个漂亮的女孩捧着一个苹果,女孩穿着漂亮的裙子和高跟鞋。摄影灯光,四 k 高质量杰作,我们把它放到我们的正向提示词里面,我们就 反向提示词,我们就常见的低化制,我们生成一下,这时候就生成了,我让他拿着两个苹果,我已经把我的提示词改成了两个苹果,他却没有改,所以说我们就试着能把这些东西的权重调整一下,让 ai 开始重视这件事情。 怎么挑权重?第一件事就是顺序,越往前的东西他顺序越高,所以说第一个顺序是,呃, pretty go, 漂亮的女孩,那么他就会把一个漂亮的女孩放在最前面,他是肯定会出现的东西。 然后呢,这两个苹果他可能没有把它放在权重很高的位置。我们有很多个方法来加权重,比如说大括号可以增加一点一倍,并且可以叠加使用,花括号可以增加一点零五倍,方括号减少一点一倍,这些我觉得都会让人眼花缭乱,不如只记 记住一种最实用的方式,他既可以增加权重,也可以减少权重,那么就是大括号加冒号就是大括号,你的主体加上冒号,一点三上下的话,我建议是根据一为单位上下零点五,如果多了的话会出现更大的错乱, 那么我们现在是一点三,等于说就是给两个苹果增加了零点三的权重。我们再来试一次,可以看到苹果的尊贵性立刻就上来了, 他手里拿着两个苹果,甚至坐垫也开始变成了苹果。一个就是提示词的权重的作用,高质量,你的反向提示词是 local 一体,低质量,然后你生成一下,接下来我会给大家讲解这个, 就比如说第一个的作用是把上一次的提示词还有这些全部都复述一遍,因为你可能做到一半,你上次忘记保存了,你觉得 上次那个风格很好,你想要再复现点一下他,他就会把你这个全都复原,我觉得是一个救命的按键垃圾篓,就是把他们都删掉。这个很简单, 这个是能将当前的提示词保存为模板风格。比如说像我们的高质量或者是负面关键词这种低质量呀,他们都是一个很常用的,所以很多就很多人就会做一些高质量和低质量的骑手式,也就是一个模板, 你每一次写作的时候点一下它,就等于说加了你这一串模板的词,它是一个很方便的东西。比如说我把这个存一下成为高质量, 好,我就把这个存下来了。那么我们怎么用这个模板?点击一下这里,我们选择这个模板高质量,你还可以存点别的,比如说人像呀,产品 背景呀,什么什么各种之类的都可以,他们甚至可以多选混合用。你选择很多之后点一下这里,他就能把你运用到这里来,这是一个组合的形式,使用的东西,落日的形状代表这些附件,这些附件是什么意思? 首先是这个 embedding, 他像是一个那个关键词的那种整合包,就比如说你点击这一个,这个就会出现一个词,你看他是一个词,但是呢他这一个词里面可能包含上百个单词。你就比如说你写了一篇文章放到里面, 或者是你很仔细的形容了一个迪士尼公主的角色放在里面,这可能描述了上百个单词,就是为了描述那个公主,你点一下他,给他加到这里面来,就等于说是套一个模板吧,还是很好用的。这个超网络就是微调的意思,但是现在几乎没有什么人用了,大家可以 忽略。模型的话就是我的大模型不管了, lora 模型就是 lora, 就是一个小模型,你可以是脸部的 lora 呀,人物的 lora 呀,或者是衣服的 lora, 反正就是有很多这些可以叠加使用。但是呢,他一定不要出现所有的比重都是一的那种情况, 那样子你会出现错乱,你可以比重是零点九,这比例小一个,有一些比重是一点一这样子比重加一个。接下来是这个采样方法,前面的其实都是古早的采样方法,大家可以直接忽略, 这个的意思就是快速消造,反正用下来目前最快且最好的一个方式是 d p m 加加 s d cars。 采样迭代步数决定了画面的细节度肯定是越高它的细节度越好的,但是呢,一般 从二十步开始,他剩下的细节都是一点点一点点的变化,大家的显存可能也受不了,所以说一般的采样步数大概就是二十到四十,你显存低的可以就选二十。 嗯,稍好一点的选择四十,再往上变化不是很大,必要性不是很高。面部修复你是当画真人的时候才开,其他的时候不用开。平铺和分块的话,就是做那种平铺图,一般是没什么需要的,不要点 高清。修复的话是一种一种放大图片的方式,这个放大图片的方式我会在下下一期跟大家统一讲。 这个高度,宽度的话呢,就是要生成图片的宽高下来是这个生成批次和数量,这些你可以这样理解,就是你,你是个包工头,你给你电脑接了个活,生成批次是一, 那就证明你这一批只用干一个活。生成批次是二,那就等于说你这一批干完了,还要干下一批,这就是批次,每批的数量就是你这一次要干几个,比如说你每批的数量是二, 那就证明你这一次干活你要同时干两个,所以说这对你电脑的压力就很高。你比如说你图片是五一二乘五一二的,你一批本来只用干五一二的, 结果你这一批做俩,那就是两个五一二乘五一二,所以说对电脑的要求就很高,一般显存不是很高的,就只改生成批次,不要改数量。 提示词相关性就是跟提示词的相关程度,测试下来是选择七到十二的效果会比较好,但是呢,具体的东西还是要根据你需求的画质来,你是想要偏 提示词一点,还是想要部片提示词一点?这个种子的话,你点这个骰子,他就是负一,就是随机种子,你点一下这个 循环,他就是确定了一个种子脚本会下一期跟大家讲,因为还是比较复杂的。如果感觉这期视频对你有用,记得点赞、收藏加关注,我们下期再见!
日常 ai 工作电脑,这是家具类生成好,这是我们的客户爸爸的产品,这个是床头柜,那怎么做呢?我把这个床头柜先找一个合适的背景啊,这个背景呢也是用 ai 生成的,然后我们再把这个床头柜用 ps 把这个跟他跟场景去做融合,调成一个 合理的尺寸大小,然后点击保存,然后我们再开始打开我们的 sd, 好, sd 放进图身图,好,把刚才生存保存好的图片放进去,对,在这里来点击一下,快点 快点好,然后我们再往下看一下,参数什么的,我已经放在后面了啊,最后的时候我给大家去保留下来,在最后展示给大家自己去看啊,然后生成五张六中炫,呦,好,点点,生成好,我们来倒计时吧,五四三 二一零, go, 哎, nice, 我们来看一下五张,这张不行,这张不行,这张不行,这张还可以。 好,我们再看一下,我们就选这张吧,这张还可以啊,我们就选刚才那一张,还不错的,我们再用,可以发现这个细节不对啊,那怎么去改变细节呢?我们来看一下啊,我们直接来看下这个原产品,那细节哪里不对呢?哦,这里不对啊,就这里指数不太对劲,然后呢,我们需要用我们的 ps 来给他 搞一下,嘣,哇哦,买噶哦,看到没有,我们已经完成了我们今天的工作流程。好,这就是我们今天带来的家具类的生成,后面是关键词,大家可以点喜欢和收藏保存下来。
大家好啊,我是小生,然后我们接上一期的视频,我们上一期讲了那个纹身图的使用,然后今今天呢,我就给大家讲一下这个图身图的, 然后这个图声图,你看一下他的界面实际上是和那个纹身图特别像的啊,唯一的区别就是多了一个这一部分 和这边的两个按钮 啊。首先说一下这一部分,这一部分呢他分了很多个选项卡, 然后我们 说一下这个图深图里边呢,他主要的用途呢?比如说这种从真人生成一个漫画的一个风格的图片, 就是用这个土生土就可以达到这个效果。然后我说一下这几个选项卡中,我们一般用到的都是这个土生土和和这个局部重绘啊。其他的这几种我基本没有怎么用过, 很少啊。这个绘图大概的意思就是就是在你的图片上去进行一个涂鸦,然后会把你涂鸦的内容去生成到你当前的这个图片里面,大概是 这个样子。然后这个这个呀,我刚刚试过了啊,这个实际上是和这个绘图表现像是一样的效果,然后这个我也没有用过。 然后这个 p 处理的话,一般是可以用来批量做一个裁剪或者是拉伸或者是放大的一个用处,这就是你填两个目录, 嗯,这个主要是一个辅助,辅助作用的一个 一个选项卡。然后我这里就不详细去说了,这个我现在主要要说的是这个图深图和这个局部,总会先说一下这个图深图,这个图深图呢有两种,一种就是在这个地方去选择一张图片, 比如我现在就是选择一张图片,然后选了这张图片之后呢,我们可以用这两个按钮去生成一个相应的一个提示词, 然后这两个有什么区别呢?上面这个他是会生成一个自然语言,有时候他就是一一句话或者是一段文字的一个描述,然后把它翻译成英文了, 是一段英文的文字描述。然后这一个深层的就是类似于我们经常使用这种 词汇描述,就是他分成了一个一个一个单词的一个词汇的描述,然后这个就是我刚我用这个去 对于我这个图片去获取的一个相应的词汇描述。 然后下面这个缩放模式, 这个说话模式的话是和我们这个宽度和高度相关的,就是你要你要深层的这个图片的宽高比, 如果和你这个原图的框高比不太一样的话,你就要做相应的一个要处理的一个方式,是要去进行一个裁剪还是去拉伸,还是做做一个填充, 或者是一个放大, 这个放大一般是同比例,就是你如果说是你的原图片 尺寸比较小,你想把它放大一下,比如说你的原尺寸是五幺二乘七六八,那你这个地方 是一零二四乘幺三三六 的话,就可以需要用这个,就是这个是可以用来把你原土去进行一个等比放大的时候,需要用到这个选项, 然后具体就看你要你的情况是什么样的,你的参考图和深圳图的一个情况是什么样的,去做相应的选择就可以了 啊。其他的这些就是基本和纹身图里面的一样,然后再就是多了一个这个重绘程度,这个重绘幅度的话就是 你的生成图片和你的参考图片的一个相近程度, 如果说你这个重绘程度比较小,那么你生成的图片就和你的原图越相近。比如我这个地方用零点二去生成一个图片的话, 那就和原图就很相近,就变化不是很大,虽然说他有一定的变化,但是变化不是很明显。 然后如果我把这个比例调大一点,调到零点五,然后我们再去生成一次, 哦,可以看到他变化就比较大了,就根据当前的这个参考图去生成的一个动漫的一个人物, 这就是我们前段时间比较火的用真人去生成动漫人物,对吧?就可以利用这种方式去生成, 哦,忘记说了,如果说我们要生成动漫人物的话,我们就得去选择一个模型,选择一个二次元的一个模型,比如说这个地方的 energy 三点零, 他就是一个动漫的模型,也可以选择其他的, 这个是这个土生土的第一个需要用到的用处。 还有一个方式就是不是在这个地方去进行一个扫描,是从我们的纹身图里边, 就是你纹身图里面去生成的一张图片,对吧?然后你想利用纹身图里面生成的某个图片去进行一个 涂成,涂了一个深沉的画 就可以拥有这种, 他会把自动的从纹身图里面把相关的那个提示词给拷贝过来, 这个就是他会,就是你需要对你当前的这个生产的这个图片做相应的修改,或者是生成一个和你当前这个图片的风格类似的图片的时候,就可以用到这个图声图的情况, 比如说我这个重回程度调成零点三五,然后去生成一下, 哦,这个变化不是很大,我们尝试调大一点, 其实还是有一点变化的,比如这个发饰啊,这个变化就要大一点。 就这种方式的话,一般是用来什么呢?一般是用来生成同一风格的图片的时候,批量生成一些 同意风格的图片的时候,就可以用这种方式从我们的纹身图里边生成一张图,之后回到我们的 图生图,然后再去生成类似的图片,那就达到了一种同一风格的一个图片的一个生成。我们再来说一下这个局部重绘, 之前我已经提到了这个局部重绘就是用来如果说你的局部有某些不是很好,可以只对仅仅只对这个某一部分去进行一个重新绘制, 比如说我这个地方这只手不是很好,需要对他去 进行一个重新的绘制,就可以在这个地方,这个地方是可以调那个笔绘大小的, 调大一点 啊,这个地方是可以回推我们的那个画笔操作的啊。我们重新再绘制一下, 然后再看一下这个蒙版的,一个是这个从会蒙版内容和这个从会飞蒙,这个很容易理解的吧?这个看你具体的需求, 把这个蒙住,蒙版蒙住的内容,哦,蒙住的肯定就是这个原图的内容啊,这个基本上就是这个原图的内容,不需要去做其他的选择。 然后从会区域,这个从会区域我要重点说一下 这个重绘区域,如果说你是从这个纹身图里面过来的,填充了这个词汇的话,我建议是选全图,不要选景萌版,因为这个景萌版的话,他是 他这个提示词是只对,是只对这个蒙版部分去进行一个联想的, 如果你选紧蒙版的话,就会出现一个什么情况,就会出现他会在你蒙版部分的内容绘制你词汇相关的内容。 比如我演示一下吧,我现在如果选择进蒙版的话,会是一个什么情况 啊?很尴尬,就是翻车,我们再来一次,是他有一定概率 啊。好,终于出现了,就是他会有一定的概率会出现我这种情况,他就会在我们蒙版的部分 去绘制一个我们这个提示词相关的一个内容, 只说有一定的概率会出现这个问题,所以我刚刚试了很多次才会出现一个一次这样的效果,所以我建议是选择重绘前途, 因为你就算选了全图的话,他也不会对你蒙版其他地方的内容去进行一个改变, 而是他会根据你的蒙版部分和提示词 去对蒙版部分去进行一个重新绘制,然后根据 据他需要绘制的内容而对你的全图的部分内容去做一个相应的调整。我们来试一下。 好,我们看 啊,我们这一次生成的还是不满意,少了一根手指,我们再来一次, 很可惜,还是不太行。嗯,再来一次, 很遗憾,我们还需要再来一次。 呵, 事实证明啊,这个 ai 绘图呢,它对于手啊脚啊这些的处理确实是还不够影响 啊。我这里只是给大家演示一下这个局部从会具体的作用是, 一般就是这种情况,我们遇到了某些局部的内容不是很满意的时候,就需要在这个地方去进行一个 重新的一个绘制,但是这个的话很靠运气, 因为不一定他重新生成的内容是你满意的效果好,我们这一次我只能说这一次生成的效果勉为其难,还算可以。 好,我这里再就不做其他的眼神,因为这个 不知道要生成一个满意的需要多久,具体他的用途就是这一个, 因为实在是有时候你可能仅仅只有某一些某一局部的一个详细解决的,对这张图片不是很满意,需要去重新生成的话, 就需要用到这个局部。总会啊,这个图称图的话,主要就是这两个选项卡的用途比较多,其他的几个基本上是没有什么太大的用处,也用不上。 其次就是这个批量处理可能还会稍微有用一点, 就是你需要对图片做批量的处理的时候就可以用这一个。 但是一般情况下我们用来做图片处理的话,我们有更好的工具,比如这个附加功能, 这个附加功能里面就是可以做相应的这个图片的处理,就是单张图片的等比的缩放, 就是你如果生成的一些图片想要提高它的质量,可以在这个地方去进行一个处理,或者是 你自己的一些老老相片也可以在这个地方去做一个高清的修复也可以。 我这里也是顺带给他们啊,说一下这个附加功能啊,这个批量处理就是 很容易理解,就是这种单张处理了变成多张处理了, 然后这个目录也更容易理解,这个就是这,这个就是只能上传一张,这个就是可以上传多张,这个就是直接从目录里面选取 一个目录,然后会对目录中的所有图片去做相关的处理,就大概是这个。 好,今天我就大概给大家讲到这里吧,我们下一期的话 我还没想好要讲什么,具体是什么,我们下一期见吧,好吧。
hello, 大家好,前面的两节课我们简单介绍和学习了纹身图的用法,那么今天的课程我们就继续讲下 steptifusion 的图声图功能和使用方法,希望大家给个一键三连。 我们先打开 web ui 界面,纹身图的旁边呢就是图身图,图身图你可以简单地理解为就是基于一张图,按照你指定的要求去修改,其实有点类似于 ps 的功能。 我们看一下功能界面跟纹身图来比较的话,哎,他这里多了一个图片上传的一个窗口, 然后下面是一差不多的啊,这里多了一个缩放模式的一个选择, 还有多了一个重绘幅度,这是一个非常重要的参数。嗯,下面我会重点讲一下重绘幅度的一个使用。 我们先随便上传一张图片,这是一个漂亮的小姐姐, 拉到下面,我们看到这里有一个缩放模式,仅调整大小,什么意思呢?就比如我们要调整他的一个宽高比,他是一个长方形的图, 那我要把它改为正方形的五百一十二乘以五百一十二,我们看一下效果。 哎,我们看到重绘生成了一张正方形的一个图片, 但是因为我这里的重绘幅度数值比较高,有零点七五,所以呢,它生成出来这张图片 跟原来这张图片区别还是很大的,那我们先调低它的一个重绘强度, 我们深层看一下。哎,还是原来这张图因为重绘幅度调低之后,在原图的基础上啊,并没有太多的一个呃,修改和变化。那么我们可以看到 缩放模式就是仅调整大小模式,这张图片就强行把它拉伸或者压缩到了五百一十二乘以五百一十二的一个尺寸,大家可以发现 啊,整个人物都变形了。这个仅调整大小的模式,就仅仅适用于跟原图尺寸大小一致的图片进行一个重绘。 那我们这里怎样调整重绘的尺寸跟原图大小 小一致呢?这个很简单,我们看到这里有一个三角尺的一个标志,我们点击一下,哎,现在他的这个尺寸就变成跟原图的尺寸一样了,那我们把重绘幅度调高,我们看一下, 哎,重新生成的这张图片,它的尺寸就变得跟原来图片尺寸大小是一致的。 第二个,裁剪后缩放呢?那么就是比如我想把这张图片从长方形改成正方形的,宽度和高 高度是一样的,那我们再来看一下, 这个时候我们就可以发现重新生成的这张图片呢,他是把原图裁剪成了一个六百四乘以六百四的一个尺寸,上面和上面部分和下面部分给截取掉了, 相当于 ps 里面按一个固定尺寸截图的一个功能。 我们再看看缩放后填中空白 如我把它的宽度拉到八百四, 这个时候 大家可以看到原来正方形的时候,它是以边界的像素点啊,向外面又重新进行了一个绘制,左边右边都是啊,这个功能就非常不错。 第四个,调整大小,潜力空间放大呢,这个其实用起来跟第一个调整大小差不多,那我们日常使用其实用前三个就好了。 那么接下来重点讲一下重绘幅度,重绘幅度的范围是零到一,数值越小就图片变化越少,越接近于原图,数值越大的话, 重绘的效果越明显,图片变化也会发生重大改变。 那么下面呢,我用脚本中有一个图表功能,给大家演示一下不同的重绘强度值所生成出来的结果有哪些区别? 从零到一啊,每个参数之间相隔零点一,用逗号间隔。 根据这张图表我们可以看一下,当重 不会强度值越来越大的时候,哎,我们这一张图片所发生的变化越来越多,从零点七开始,零点八,零点九,一点零, 那我们所生成出来的图片跟原图就相差越来越大,大家呢,可以自己去尝试一下,根据自己的一个需求去调整重绘的强度,让 ai 发挥创作的一个想象空间。 如果小伙伴们想做一个属于自己的风格画头像,那我们就可以用 stable diffusion 的图声图功能,把真人照片转化成比如二次元风 格的一个照片,定制属于自己的二次元风格形象。就以这张图片为例,我们来操作一下。 首先呢,我们模型选择上,我们肯定是选择一个二次元风格的模型,这里呢,我选择的是 aw panting, 嗯,这个二次元风格模型 外挂 v a e 就是滤镜,还是选择这个八四零零零零,然后提示词,这我暂时啊,不写图片,我们已经上传。 然后图片尺寸就是原图尺寸,叠带步数,我调成习惯使用的三十步,采用方法就使用二次元风格长 常用的 ula 面部修复,打开 重绘幅度,我这里暂时先调成零点五,抽一张卡,看看是什么样的效果。 点击生成 啊,这里我忘了,把脚本给关掉了, 好,取消掉,重新生成一次。 好,这样我们就得到了一张基于 我们自己照片生成的二次元卡通形象,可以作为我们自己的一个头像去使用。如果觉得这个卡通形象呢,跟自己原来形象还是有差别的,那我们可以调低一下他的重绘幅度,把它调成 零点四毫米,我们再生成一次, 这样大家觉得跟原图像不像呢?下节课呢,我会继续讲图声图的涂鸦和重绘啊这些重要功能啊。喜欢我的视频的话呢,记得给个一键三连,大家下期再见。
这期主要讲一下新出来的 lcm 模型,我使用的是 sd 一点五的麦菊显示模型,大概用了三秒钟的时间就生成了十张图,生成的图像质量都还不错,也没有出现图像崩坏的效果,终端中显示整个生成的时间就是三秒, 这在之前是不可能想象的事情。那么 l c m 是什么?它提升图像生成速度的原理是什么?我们又应该怎么样使用呢? l c m 的全称是翻译过来是潜在一致性模型,是由清华大学交叉信息研究院的研究者们构建, 他们通过创新性的方法使用 lcm, 只需要四到八步的推力就能生成高分辨率的图像,而不像之前需要二十五到五十步,所以大约只需要一秒 中就可以运行 sd sl 模型,而在麦克电脑上生成的速度相比之前快了十倍。这个数据在后面官方还有专门列出来的一个表格。 那么刚刚提到的创新信息方法是什么呢?在这里他们也概述了一下 lcm laura 的核心思想就是仅训练少量的石佩奇,而不是完整的模型。我的理解是 sd 一点五或者 sdxl 模型,通过 lcm laura 的过程 只蒸馏出了针对 lcm 采样器最有效的信息被保留下来,所以在使用 lcm 采样器,只需要很低的步数就可以生成不错的图像, 从而提升了生成速度。那么通过 l c m nora 真牛之后生成的图像质量是否会差了一些?来到质量 量比较这里可以看到,使用的步数越多,图片的细节也就越出色。但是在第三步的时候,其实图片的整体效果已经非常不错了,而如果使用原来的 sdxl 模型,想要生成整体效果优秀的图片大概需要二十步, 而二十部之前的图片几乎都不能使用。所以根据官方的说法就是使用 lcm 生成图像,相同的图像质量,但是速度快了很多。 为了让你好理解究竟快乐多少,官方还放出了在各个不同的硬件平台上使用 s d x l lora, l c m 四部生成的图片时间和 s d l 使用二十五部生成图片的时间。其中我觉得最出色的就是在 mac 系统上使用 m 一 max 芯片,生成的时间分 别是六点五秒和六十四秒,速度相比之前快了接近十倍,所以使用 s t x l 的门槛又又降低了。 当前我们主要能够使用的 lcm laura 的型号主要有三种,分别是 lcm laura sd xl、 lcm laura sd 一点五和 lcm laura ssd。 完毕 前面两个 lora 都很好理解,就是对应 s d s l 模型和 s d 一点五模型使用,而这里的 s s d e b 模型又是什么?可以简单介绍一下。具体的 s s d e b 模型我们放在下一期详细介绍。 s s d e b 模型是一种经验的 s d x l 模型,比原始的 s d s l 模型小百分之五十,速度快百分之六十,所以再搭配上 l c m lore, 就是快上加快 快。现在我们可以在 confi ui 上体验 l c m 的完整流程。不过在使用之前,你需要打开你的 manager, 在商店中 搜索 lcm, 下载这个 lcm simper, 然后还是在 manager 中点击 update all, 将你的 confiel i 更新为最新的版本,然后再重启 confiel i 即可。我已经搭建好了工作流,这个工作流是不是非常的熟悉?没错, 其实就是使用最基础的纹身图。工作流增加了一个 lora 加载器。不过有一点不一样, 之前使用 laura 加载器需要将 clip 节点连接到文本面码器上,而使用 l c, m laura 的时候则不需要,只需要将 laura 节点连接到采样器上即可。如果你使用的是 s d 一点五的模型, l c, m laura 就对应选择 c 一点五的工作流,就是这么简单。然后就是采样器上的参数调节。根据 l c, m 的原理,首先你需要将采样器修改成 l, c, m。 调度器的选择可以根据你自己的喜好。我这边测试下来, d d i m uniform 和 s g m uniform 的效果比较不错。然后降低 c f g 和步数,一般 c, f g 在一到二之间,步数可以在四到八之间都能获得还不错的效果。 点击生成一下,可以看到生成的效果和速度都是非常不错的。生成一张图应该不到一秒的样子, 切换到 s, d, s l 模型这边也相应地切换到 l c m laura。 s d s l。 尝试一下效果。 生成的速度还是很快,大概是两到三秒一张图,但是效果没有那么清晰了。多尝试几张都是同样的效果。或许是提示词的原因,也有可能是步数太少的原因。 我将步数调整到八,我们再尝试生成一下。生成的图片明显变得更加清晰了。 如果你想要搭配其他的 lorra, 需要复制一个 lorra 加载器,将它们串联起来,在提示词中添加触发词,就可以获得 lorra 的效果。最后还有一个 model 生 playing described 模块,这个模块建议在串联 lora 的时候一起使用,以防有的 lora 不产生效果。 然后我再串联一个墨星的 lora, 这个 lora 的风格化比较强,这样就能很容易地看出 lora 在工作流中产生的效果。点击生成一下, 可以看到深沉的图像,有着明显的水墨风格。接下来再尝试一下能不能结合 ctrl lat 使用。 我迅速串联了一下 ctrl lat 工作流,这里我使用软边缘的 ctrl lat 模型,点击生成一下,可以看到生成的图片成功 通了。也有可能是服装被 ctrl lat 识别,所以生成的图像并没有汉服的特征,所以我稍微降低了 ctrl lat 强度,删掉了汉服的 laura, 增强了墨芯的强度。主要就是看 lcm laura 是否能和 ctrl lat 结合使用,再生成一张效果和预期的差不多。 看来 sd 一点五的模型结合 lcm laura 能够适应 laura 和 controlled。 最后再添加一个 sd upscale 的模块,让图像细节增加尺寸,放大一下试试。 在这里同样可以把采样器调整到和前面的采样器相同的参数。 试试放大图像的流程是不是也会变快。点击生成 可以感受到放大图片的流程也同样变快了,而且放大之后同样添加了细节,那么结合 animate def 生成动画同样也是可以的。这个之后我会单独出一期视频, 现在虽然在外比外上还没有 lcm 的采样器,但是我也尝试了一下能不能用 lcm laura 结合现在已有的采样器达到提升生成速度的效果。 我对所有的彩阳器进行了测试, sd 一点五的模型使用的还是麦菊写实, cfg 步数使用的是一点五,分别生成了步数为二到八的图像测试效果。 cfg 步数使用一点五,其中有不少彩阳器, 且都能生成还不错的图像,其中有八个采样器可以在四步内生成完整的图像,大家可以参考这张图来进行采样器的选择。 sdxl 模型进行测试是使用的是原版模型, 生成的效果就比较惨不忍睹了,几乎没有一个采样器能够完成完整的图像,唯一能够生成图像的也就是 ola a 了,但是这样的图像质量应该也不能使用了,或许需要等到 w b o i 对应更新 l c m 采样器之后,生成的图像质量才会有很好的改善。 最后 l c m laura 可以到官方的 hocking face 上进行下载,如果嫌麻烦的话, b 站的小伙伴可以在视频简介中获得我整理好的模型包,其他平台的小伙伴可以加入我的粉丝群获取模型包。最后总结一下, l c lcm laura 在 confiya 上使用能够获得比较不错的加速图像生成的功能,并且 lcm laura sd 一点五支持与 controlled、 sd、 upscale 等等结合使用。 这就是本期的全部内容了。如果这期视频对你有帮助,请大家一定记得帮我一键三连,我是设计师,学 ai, 我们下期再见!