这篇博文介绍一下YOLOv5自带的一个生成标签的方式,前提是有一个已经训练好的权重!! 1、权重可以来自官方提供的,比如v5的权重包含80类别,如果包含了你要训练的类别,就可以用官方权重去打标签;2、或者你的数据集打好一部分标签,自己先训练出一个权重,用训练出的权重去检测剩下的图片,生成标签文件等等。
目录
1、利用现有的权重去检测图片,得到标签文件
1.1修改相应参数
2、对生成的标签文件使用IableImg进行微调
3、将所有标签微调好了后,下面是对数据进行划分。
1、利用现有的权重去检测图片,得到标签文件
找到YOLOv5的detect.py文件,以我下面检测行人为例,可以去官网下载YOLOv5X.pt,因为官方权重包括行人类,所有可以直接使用,这里建议下载最大的,因为检测精度高。
1.1修改相应参数
1、参数save-txt的末尾添加default = True,这个参数就是保存检测的标签文件。
parser.add_argument('--save-txt', action='store_true', help='save results to *.txt',default=True)
2、参数nosave的的末尾添加default = True,这个参数是是否保存检测后图片,设置不保存。
parser.add_argument('--nosave', action='store_true', help='do not save images/videos',default=True)
3、然后官网权重是80类别,我现在只想检测行人,可以在pycharm的Termina运行该detect.py
时加上--classes 0,就是只检测行人这个类。
python detect.py --classes 0
4、接下来去找刚才的运行结果,一般默认保存在run/detect/文件夹下,存在一个labels文件,就是我们需要的标签文件。
2、对生成的标签文件使用IableImg进行微调
1、因为用初始权重得到的标签的坐标框信息可能存在一些误差,所以还需要进行手动微调,哈哈,是不是又回到了最开始的打标签的时候,这样其实已经能节约很多时间了。
2、将最开始测试图片和得到的labels文件夹放在一起,使用labelImg打开该文件夹。
打开labelImg之前,先在labels文件夹下手动创建一个classes.txt文件,里面写上你的类别名称,防止labelImg的闪退。
3、设置打开的图片文件夹,设置保存标签的文件夹,如下图
完成图片中1,2步后,第3步双击右侧图片,即可对框进行修改。
4、打开自动保存功能,如下图
3、将所有标签微调好了后,下面是对数据进行划分。
1、这里提供一个将数据划分为如下格式的脚本,也能用于v5的训练。图片如下
2、脚本如下:只需要改main函数中,文件路径、rate比列(训练集,验证集比列)。
import os
import random
import re
import shutil
def creat_files():
try:
shutil.rmtree('./data//images')
shutil.rmtree('./data/labels')
except:
pass
try:
os.makedirs('./data/images/train')
os.makedirs('./data/images/val')
os.makedirs('./data/labels/train')
os.makedirs('./data/labels/val')
except:
pass
def read_files(path):
dir_list = os.listdir(path)
for i in dir_list:
#利用正则表达,切割出图片ID
image_id = re.match(r'(.*)?.(jpg|png)',i).group(1)#图片后缀为jpg,png,可自行添加后缀格式
labels_name = image_id+'.txt' #由图片ID找到对应标签名
prob = random.randint(1, 100)#随机数prob
if (prob < rate): # train dataset
old_images_path = path_images + '/' + i
new_images_path = './data/images/train' + '/' + i
old_labels_path = path_labels + '/'+ labels_name
new_labels_path = './data/labels/train' + '/' + labels_name
shutil.copy(old_images_path, new_images_path)
shutil.copy(old_labels_path, new_labels_path)
else: # val dataset
old_images_path = path_images + '/' + i
new_images_path = './data/images/val' + '/' + i
old_labels_path = path_labels + '/' + labels_name
new_labels_path = './data/labels/val' + '/' + labels_name
shutil.copy(old_images_path, new_images_path)
shutil.copy(old_labels_path, new_labels_path)
if __name__ == '__main__':
path_images = './images' #图片的路径
path_labels = './labels' #标签路径
rate = 90 # (1-100)之间,90即练集与验证集比例9:1,可以改成自己喜欢的比例
creat_files()
read_files(path_images)
3、运行脚本会在代码根目录生成一个data文件,里面划分好数据,如下:
4、可以直接把这个data文件夹剪切到YOLOv5中进行训练了。