粉丝2664获赞1.6万
大家好,我是小杨,上次发布的 uloves 开源项目已经突破八千多人观看了,今天我来给大家分享一下如何使用 uloves 训练自己的目标检测数据集,并进行模型的推理使用。 首先让我们了解一下 ulob 十的不同型号已满足不同的应用需求。 ulob 十纳米版本适用于资源极其有限的环境。 ulob 十 s 小型版本兼顾速度和精度。 ulob 十 m 通用中型版本 ulob 十 b 平衡型宽度增加,精度更高。 ulob 十 l 大型版本精度更高,但计算资源需求也更大。 ulob 十 x 超大型版本可以实现最高的精度和性能。接下来让我们来配置环境,使用康的创建虚拟环境。进入项目目录后执行以下命令,准备好数据集后,将需要训练的数据集放入项目目录下,并按照指定的格式进 行组织,格式如下,接着让我们来训练模型,请注意这里需要导入 ulo 十模块,而不是 ulo 模块。训练代码如下,点击运行后,训练将开始,打印出的网络结构如下,最后让我们来看一下模型推理的代码,代码如下,运行后结果将直接显示推理结果我已经整理好了 ulov 制密时相关代码和论文,还有二十种常用的小样本、目标检测方法以及 uloves 训练自己的数据集。如果你对 ulol 感兴趣或者正在学习目标检测,那这些资源可是绝对不能错过哦!我是小杨,每天带你探索一个 get up 的热门项目。
大家好,我是多多,欢迎大家观看我按键精灵有篓人工智能识别第零节,这节课呢呃,咱们给大家看一下演示。呃,这一整套课程呢属于进阶的教程, 然后建议大家在网上学学我的基础教程在学这个啊,因为我的基础教程在网上有很多,在这呢给大家看一下 啊,这个传奇呢,是我自己搭建的本地版的啊啊,这个是我个人的啊,我再说一遍啊,这个是我个人的,是我本地搭建的。 呃,既然我会这么多技术,我自己搭建个传奇应该很容易吧。 大家看一下这个检测的这个效果, 在实际操作的时候他这个检测出来会把这个坐标并返回出来,大家看一下。 呃,这个技术呢也可以用在呃办公里面,然后可以帮你用来检测一些重复性的工作, 大家看一下细节啊,没有遗漏的看一下, 当然我会出好几个这种检测的这个呃演示给大家看一下他的那啥看一看,看一下他的功力啊 大大家看一下这个细节部分啊,这个位置这个位置看一下啊这个角的这个位置, 然后这个位置看一下。啊 啊,这节课的演示就到这了啊,大家到时候需要的资料和插件部分呢,我都放在这个群里面了 啊,大家有什么问题可以找我去问。然后呢咱们接下来,嗯再给大家演示几个功能之后呢咱们就开始讲这个, 呃,讲这个人工智能识别这部分的课程啊,这节课咱们就到这了。
上一节课我们已经学习了如何训练文字识别模型,今天我们来调用模型完成验证识别。 我们打开幺六综合工具,载入我们训练好的模型,验证模型是否正确有效, 模型能够正确识别文字,说明模型没有问题。接下来我们开始写代码调用 载入幺乐模块和精益模块 创建对 向,以便接下来的调用 需要。先用目标检测检测出文字的坐标位置。 初始化完成调用的前置条件,载入目标检测模型, 直接将模型路径复制粘贴进代码,后续参数按视频所示填写 识别图片,识别到的数据将会保存在幺六数据这个变量里, 判断目标检测是否识别到文字,并对每一个文字传递给分类检测,判断其内容。 对 分类检测进行初始化,载入分类检测的模型, 这里我们用目标检测识别到的坐标数据,将原图片该位置裁剪下来,将裁剪后的小图片传递给分类识别,检测其文字内容。 调试输出所有识别到的结果。 运行代码查看输出情况, 代码未能成功运行。经过 做检查是因为输入图片不是 yellow 所需要的格式,我们对输入图片进行转码, 最后成功给我们返回了所识别的文字以及该文字的坐标位置,方便我们后续操作。 到此,我们完成了对文字的识别。
今天我们来学习第二节的内容,代码调用模型进行多线程控制。我们打开多个雷电模拟器,首先写个代码,将打开的雷电模拟器排列好, 通过媒举所有窗口巨柄,筛选出雷电的巨柄 调试输出,查看雷电窗口的名字, 只要名字中带雷电模拟器的窗口即为我们所需窗口。 创建程序级变量雷电模拟巨柄, 循环对每个窗口进行位置和大小的调整, 还是把代码放在按钮事件中吧,方便测试。 可以看到窗口已经整齐排列好了。 再次测试有 book 回来修改一下, 原因是我们没有把雷电聚丙数组初始化, 现在窗口排列程序代码已经完成, 将我们需要的模块加载进来, 创建大漠程序,即变量,这里要注意变量类型为数组。 创建优 solo 程序及变量,这里要注意变量类型也为数组。 接下来我们完成大漠的前置调用代码, 我们要循环对每一个窗口创建一个大漠和 rolo 多线程调用模拟按键需要用后台模拟,所以我们要测试一下窗口的 后台模拟绑定模式, 创建一个测试此程序 循环启动多个县城对每个窗口均进行测试, 经过测试鼠标的 windows 三模式可以后台模拟。 接下来我们处理 rolo 多线程的调用,使用方法和大漠类似,需要对每个窗口绑定一个 ulo, 对每一个优楼都进行初始化和加载模型。 ulo 多线程调用需要的是 param 和变模式的模型。打开综合工具,对之前训练好的模型进行转换格式 加载模型。 直接把测试此程序改成 ai 识别的程序吧。 下一节课,我们将学习如何用 ai 进行识别,并结合模拟按键。
今天我们来全面了解和学习一下肉肉工具训练 ai 模型的步骤和方法。本工具只能训练力三和 b 四模型,力四与力八相比,优点是使用方便快捷,不需要安装任何环境和软件。 潜力四模块可以任何电脑直接调用,对机器设备没有要求。力八相对于力四在性能上有所提升,但也需要更高的硬件要求。目前力三力四识别速度最快都在几毫秒以内,识别精度高,并且我们可以通过增加样本、 增加训练数量和制作副样本等方式提高识别精度。下面我们开始训练模型。首先点击自动截图截取图片样本。工具总共提供了五种截图方式,不同的窗口对截图的方式反馈不同,我们可以自行测试 使用哪种方式截图。点击按钮选择我们需要截图的窗口, 接下来点击开始截图即可,工具自动最小化,开始自动截图, 接着正常玩游戏即可。工具自动后台截图,按二加二可以结束截图并查看。刚刚按了快捷键,但是并没有结束截图,而是弹出了文件夹,原因是热键被游戏窗口占用了。我们直接打开软件,点击按钮查看截图即可。 这个就是方式一截取的图片,后面还有几种方式截图可以自行测试, 可以看到这种方式截图下面会有一圈黑边。 第三种可以自行选择区域截图, 下面我们正式开始提取样本,使用第一种方式截图, 接着正常玩游戏即可。 打开软件查看截图 图片,样本获取完成,准备开始标注样本, 点击手动标注创建项目名称, 打开图库,将样本图片 剪切进图库文件夹, 刷新图库,开始标记图片。 滚轮缩放图片,鼠标右键按住拖放图片 a 键切换上一张, d 键切换下一张。 鼠标右键添加分类, 输入我们要识别的目标分类 画板上侧有快捷键提示, 选中分类,然后框出图片内的目标,按 ask 默认删除最近化的一个标注框, 如果标注框被选中则是删除选中的标注框, 按空格键则会自动跳转到下一个未标注的图片。每个标注框可以自由变换形状或者位置。 按住 c、 t、 r、 l, 可以批量选中标注框进行批量操作。 按 ask 也可以 批量删除 此功能。可以自由跳转到某个图片位置, 或者搜索带某个字符名字的图片位置, 此功能可以删除整个项目。 下面选择分类,开始标注, 点击此处可以锁定图片的位置和大小, 不需要的图片直接按得利删除样本。 我们可以右键复制标注框,快速标注。 我们还可以把任意的标注框组成数据组, 修改数据组的备注, 在其他图片也可以直接粘贴某个数据组。 继续把我们要标注的目标全部框出来, 我们可以通过复制、移动拉伸、变换、创建数据组粘贴等方式来提升标注的效率。 标注了将近一半,不想标注了,我们用个洁净的方法,我们来演示一下如何用自动标注进行标记。 先创建一个文件夹,把我们的样本数据集先保存下来, 接着把我们这个数据集中没有标记的图片全部删除掉。我们进行训练的数据集图片必须是全部标注完的。好了,现在我们这四十一张图片是全部标注完成了的。 点 机上面的训练页面 我们可以看到训练分了快速识别和精确识别,以及使用 cpu 还是 gpu。 训练 同时支持 b 四模型的训练, 可以查看每个参数的含义。 如果你想更改更多参数,可以生成 c f g 网络文件,直接在文件中 更改, 此按钮可以加载任何 c f g 文件进行训练。 b 三和 b 四模型是通用的,建议使用 b 三训练。如果你是新手,可以直接点开始训练即可。初始参数已经全部设置好了, 如果出现这个页面不动,请耐心等待几分钟。这是因为电脑首次训练工具正在自动后台配置环境 开始训练了。 曲线图上面有两个值,一个是 los 值, los 值越低识别越准确。另一个值是训练的次数, 训练是以百次为单位的,至少训练一百次才会生成模型文件。 los 值是浮动变化逐渐下降,最后趋于平缓, 我们也可以随时中断训练。测试模型,如果模型识别不到,可以回来点击继续训练。 提取我们训练好的模型进行备用。 点击模型测试来测试我们的模型识别效果, 可以看到能准确的识别到 我们来直接识别游戏画面, 点击按钮将画面载入,工具 提示我们未加载模型,我们把模型拖动载入 画面与游戏同步,且可以准确识别到。 我们也可以直接在游戏画面上识别。 游戏画面上出现了绘制图形, 我们可以看到绘制的图形和实际进行了偏移,这是因为截图识别尺寸和绘制透明画板的尺寸不一致,我们实际运用中可以更改截图函数,或者对识别结果进行偏移等多种方法处理。 下面我们来演示一下 gpu 识别的方法。点击此处进行模型转换。 gpu 识别的模型格式为 power 格变格式, 转换生成的模型中有带 app 的,这是优化后的模型。 将模型拖动载入, 选择游戏画面,开始识别。 可以看到识别耗时大概是十二毫秒左右,此电脑的显卡为 g t x 幺六六零,如果是 r t x 三零六零的话,识别时间大概为五毫秒。 四十张图片训练的模型识别基本没有问题。 到此我们的模型训练已经完成, 下面演示一下自动标注功能。 新创建一个项目, 重新导入图片, 添加我们要识别的分类, 提示我们未加载模型,将我们已有的模型加载进来, 点击自动识别,自动识别出来的就是已经标记完成, 这样可以极大地提高标注效率。 如果有不合理的,手动调整一下即可。 我们也可以直接点击全部标注, 自动将我们的数据集全部标注完毕。 已经全部自动标注完毕了,接下来自己审核一遍自动标注的样本,对不合理的进行调整即可。 比如这张自动标注漏了,我们自己补上这张也有一点问题, 自动标注还可以只识别我们指定的种类。假如我新建一个种类, 我想让自动标注 只识别其中的蘑菇,这里可以勾选你要识别的种类, 比如自动识别只勾选人物和怪物, 自动识别的时候也只会给你标记人物和怪物, 我们还可以修改分类的名字来进行其他种类的标记。 通过这个方法我们可以随心所欲的进行标记, 比如我们的样本有一千张图片,我们可以先用五十张图片训练一个模型,再用这个模型去自动标记这一千张图片,能极大的提高标注效率。工具的其他功能就不再做讲解,有兴趣的可以看往期视频进行学习。
大家好,这里是微自己软件工作室,专注于办公软件安装。今天我们来讲解一下如何使用 label mg 进行标注数据级, 我们首先需要先启动这个 label mg 文件,我默认安装了,是在 anna candle 的 某个环境里面,打开 anna com, 如果你找不到的话,也可以直接搜索 anna com, 然后选择这个命令窗口。 we 不是 c m d 啊, 跟 cmd 不一样,前面有个贝斯环境,说明我已经进入到贝斯环境了。一般我不推荐大家安装在贝斯环境,因为有很多网友反馈说安装在贝斯环境的话 会会有闪退的,可能很多都闪退了,然后我们激活对应的环境,我这里是 ulo 五,如果你的是其他的环境名,那么这里改为自己对应的环境名就可以了,然后选择粘贴回车, 回车之后我们看左边的是变成 ulo 五了,说明我们已经进入到对应的环境了,然后输入 lablmg, 这样就可以启动软件了。好,我们可以看到软件已经弹出来了, 然后我们看一下常用的设置啊,在这个视图密码里面啊,这些默认化是会勾选的,我这里推荐大家跟我一样的配置啊,这几个勾选会让自己的配置呃更加方便 去选择。勾选,这有什么用?这里也都有介绍了啊,勾选他,勾选,勾选啊,这几个都勾选了, 然后我们再来打开数据级的文件夹,也是图片的文件夹,我这里是测试下面的 mg 文件,所以我复制自己的文件 文件夹路径选择 open, 第一个 open 是打开单个图片,它不能选择文件夹,所以我我这里不选择它,选择第二个,应该选择第二个。打开文件夹啊,一次性加载所有的文件, 为什么这里看不到呢?呃,没有没有关系,因为他没有预览的功能啊,只要上面的路径正确就可以了啊。粘贴, 我这里是测试下面的 i m g, 你看跟这里是对应的,选择 i m g。 原选择文件夹,然后我们看到这个文件夹里面的图片是已经被全部被加载进来了,然后我们现在开始标注 啊,怎么标注呢?嗯,右键右键这个软件,这里有一个 create, 是一个增加呃,方框的选项,选择它,然后就可以 框选自己的物体,这里给他一个标签名于选择 ok, 然后选择快捷键,切换到上一张或者下一张。必须是英文状态下的才可以啊,我们现在去切换英文状态, 选择输入键盘的 d, 好,就可以切换到下一张图片了。继续 这个标签名啊,还是这个选择,勾选下一张,下一张啊,到安全帽我这勾选,然后环境名不叫这个了啊,改为自己对应的图片啊。标签选择 ok 啊,我们可以看到我们已经标注了三张图片,我来看一下是否有效果啊。测试里面 啊,最后一张图还没有保存,我们保存一下。保存啊,可以保存,看到这里已经是有图片了。 好,这里默认的话,它是有三种格式,默认的话是选择 v o c 啊,这里打开之后我们选择 ulo 格式。这里是我推荐的 啊,如果是默认 v o c 的话,你保存的话是 chanel 图片。后续如果你使用 yolo 五的话需要转换,这个就非常麻烦啊,我这里直接选择 yolo 格式,如果你打开发现不是 yolo 格式的话,选择这个格式切换为这个格式就可以了, 然后标注完成之后,文就可以直接关闭了,因为文这里已经勾选了自动保存了啊。嗯,再来看一下啊,如果你勾选了啊, 比如说我这勾大了啊,怎么办?勾大了,我想编辑它,可以右键这个框框,然后选择编辑, 然后按住呃,点击键盘的删除键 delete, 或者右键选择 delete, 选择删除,就可以删除掉这个方框了,也可以调整它的大小啊,这样就可以了。 完成之后我们选择最后一张图,可能要保存一下,手动保存一下,因为他没有下一张了,选择保存,然后我们关闭看一下, 这就是输出后的效果啊,打开看一下是可以的。 three, 当你测试后,后续测试的话,必须要这个顺序必须要跟他的一致的啊,不然就会搞混了。 然后我们再来看一下高级的玩法啊,上面的话你就可以已经可以正常的标注了,如果你还想了解更加深入的话,可以看一下下面的高级玩法,就是看一下 好打开文章的环境,然后这里 cd 到对应的素材文件夹,也就是这里 这里就可以了,不需要打开图片的文件夹啊,这些可以先删掉,我这里建有一个文件,呃,文件里面有两 个标签名,一个是鱼,一个是 mouse, 你也可以自己后续增加一个标签名啊,但是一行一个啊。保存, 然后选择这样的格式命令来启动这个。呃,软件。 我们看到这个木样,他现在是 c 盘啊,但是我的这个素材在 d 盘怎么办呢?我们首先先需要对进入对应的盘浮, d 盘好,这样我就可以进入到对应的盘浮了,进入到对应的盘浮射,然后 cd 对应的路径选择复制 粘贴。回车,这样就进入到对应的环境了啊,对应的路径了,进入到对应的 路径之后,我们按照他的他的这个格式啊这个公式来启动他 label 啊,手动输入吧, m g, 然后后续后面加上加上的话是图片的文件夹,我这里是 m g, 你的也可以是其他的,然后再最后一个是你已经写好标签的名称的文件, 我这里名称叫做 class class, 后缀是 t s t。 回车, 这个时候我们发现他已经自动加载好这个文件夹了,然后右 键选择创建画框啊。回车,这个时候我们发现刚跟刚才不一样的是他下面是已经萝莉有这个数据级的标签了, 也就是跟我们这里是对应的,也就是说他会加载这里的信息啊,这样我们就不用每次都手动输入这个标签名了,选择勾选对应的标签就可以了,选择 d 好,这样回车,你看他每次都会都会有这个选择,所以就非常的方便,注意这个格式要选择正确啊,不然后续就比较转换的话就比较麻烦 啊,刚才可能还忘讲了这个第三个的话是一个我们保存的文件夹,选择我们保存的位置啊,就可以了, 我这里选择 moon 的测试,然后选择关闭保存完,标注完之后就可以关闭了。选择啊 还没有保存,他说我们还没有保存啊,我们保存一下,保存关闭啊,这样就可以了。