Windows使用opencv训练模型过程记录（提供样本）

最新推荐文章于 2024-05-04 12:17:17 发布

i土豆程序猿

最新推荐文章于 2024-05-04 12:17:17 发布

阅读量5.9k

点赞数 7

CC 4.0 BY-SA版权

分类专栏： Android 文章标签： opencv windows 计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/keeng2008/article/details/122211749

Android 专栏收录该内容

19 篇文章

订阅专栏

本文详细介绍了在Windows环境下使用Python和OpenCV训练物体检测分类器的过程，包括拍摄和处理正负样本、创建描述文件、训练样本以及解决训练不准确的问题。通过收集更多正样本并调整训练参数，最终成功生成可用于消毒液识别的分类器。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先按照这个指引安装好所需要的工具：

Windows环境下训练OpenCV分类器

Windows环境下训练OpenCV分类器_@陌阡的博客-CSDN博客

Python + pip

下载 opencv_createsamples.exe和opencv_traincascade.exe

准备训练库opencv_bin，自己拍照进行训练。

自己试了几个训练结果，发现都不理想。一般训练识别不准确。

后来经过多次尝试，觉得应该收集更多正样本，于是以消毒液为例子，自己进行拍照，剪裁得到正样本。我拍了130多张。

然后使用QQ截图并剪裁功能，剪裁出了质量达标的105张：

然后使用上面博主提供的1.py进行灰度和大小处理，得到正样本105张：

import os

from skimage.color import rgb2gray

import numpy as np

import skimage.io as io

import cv2

def convert_gray(f, **args): # 图片处理与格式化的函数

rgb = io.imread(f) # 读取图片

gray = rgb2gray(rgb) # 将彩色图片转换为灰度图片

dst = cv2.resize(gray, (50, 50)) # 调整大小，图像分辨率为40*40

return dst

if __name__ == '__main__':

'''

批量转灰度图

'''

datapath = r'.' # 图片所在的路径

str = datapath + '/org/*.jpg' # 识别.jpg的图像

coll = io.ImageCollection(str, load_func=convert_gray) # 批处理

for i in range(len(coll)):

io.imsave('./pos/' + np.str(i) + '.jpg', coll[i]) # 保存图片

然后使用3.py生成info.txt, 使用上面下载到的负样本生成 bg.txt

import os

def create_pos_n_neg():

for file_type in ['pos', 'neg1964']: #此处修改neg或pos即可

if not os.path.exists(file_type):

continue

for img in os.listdir(file_type):

if (file_type.startswith('neg')):

line = 'D:/DEV_SDKs/Opencv/train3/'+file_type + '/' + img + '\n'

with open('bg.txt', 'a') as f:

f.write(line)

elif (file_type.startswith('pos')):

line = 'D:/DEV_SDKs/Opencv/train5/'+file_type + '/' + img + ' 1 0 0 50 50\n'

with open('info.txt', 'a') as f:

f.write(line)

if __name__ == '__main__':

create_pos_n_neg()

print('描述文件已生成！')

生成的info.txt内容是这样的：

D:/DEV_SDKs/Opencv/train5/pos/0.jpg 1 0 0 50 50

D:/DEV_SDKs/Opencv/train5/pos/1.jpg 1 0 0 50 50

D:/DEV_SDKs/Opencv/train5/pos/10.jpg 1 0 0 50 50

...

生成的bg.txt内容是这样的：

D:/DEV_SDKs/Opencv/train5/neg/1.jpg

D:/DEV_SDKs/Opencv/train5/neg/10.jpg

D:/DEV_SDKs/Opencv/train5/neg/100.jpg

D:/DEV_SDKs/Opencv/train5/neg/11.jpg

...

这里使用的是绝对路径，那只需要复制info.txt, bg.txt到需要的目录而不需要修改图片所在的目录。

下面到opencv_bin目录下，把info.txt, bg.tx粘贴下来。生成样本文件：

opencv_createsamples.exe -vec info.vec -info info.txt -bg bg.txt -num 105 -w 50 -h 50

这一步会生成一个 info.vec文件，下一步需要用到。

在opencv_bin目录下创建一个data目录用于存放结果，然后调用训练命令：

opencv_traincascade.exe -data data -vec info.vec -bg bg.txt -numPos 105 -numNeg 315 -numStages 20 -w 50 -h 50 -minHitRate 0.999 -maxFalseAlarmRate 0.5 -featureType LBP

注意：虽然这里有1964个负样本，但是不能用那么多，只需要正样本的3倍就可以了；使用太多反而增加训练时间，影响准确率。

等待了大约5小时，到stage15后就停止了，生成了一个13kb的结果xml，测试了一下，基本能达到要求，需要还是有一定的误识别率，但是对于需要识别的本尊基本都能稳定识别到了。

其中样本已上传：

消毒液瓶doctmp.zip-机器学习文档类资源-CSDN下载

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。