这篇博文介绍一下YOLOv5自带的一个生成标签的方式,前提是有一个已经训练好的权重!!    1、权重可以来自官方提供的,比如v5的权重包含80类别,如果包含了你要训练的类别,就可以用官方权重去打标签;2、或者你的数据集打好一部分标签,自己先训练出一个权重,用训练出的权重去检测剩下的图片,生成标签文件等等。

目录

1、利用现有的权重去检测图片,得到标签文件

1.1修改相应参数

 2、对生成的标签文件使用IableImg进行微调

 3、将所有标签微调好了后,下面是对数据进行划分。


1、利用现有的权重去检测图片,得到标签文件

    找到YOLOv5的detect.py文件,以我下面检测行人为例,可以去官网下载YOLOv5X.pt,因为官方权重包括行人类,所有可以直接使用,这里建议下载最大的,因为检测精度高。

1.1修改相应参数

官方自带YOLOv5的半自动标注方法

  1、参数save-txt的末尾添加default = True,这个参数就是保存检测的标签文件。

parser.add_argument('--save-txt', action='store_true', help='save results to *.txt',default=True)

  2、参数nosave的的末尾添加default = True,这个参数是是否保存检测后图片,设置不保存。

    parser.add_argument('--nosave', action='store_true', help='do not save images/videos',default=True)

  3、然后官网权重是80类别,我现在只想检测行人,可以在pycharm的Termina运行该detect.py

时加上--classes 0,就是只检测行人这个类。

官方自带YOLOv5的半自动标注方法

python detect.py --classes 0

   4、接下来去找刚才的运行结果,一般默认保存在run/detect/文件夹下,存在一个labels文件,就是我们需要的标签文件。

官方自带YOLOv5的半自动标注方法

 2、对生成的标签文件使用IableImg进行微调

  1、因为用初始权重得到的标签的坐标框信息可能存在一些误差,所以还需要进行手动微调,哈哈,是不是又回到了最开始的打标签的时候,这样其实已经能节约很多时间了。

  2、将最开始测试图片和得到的labels文件夹放在一起,使用labelImg打开该文件夹。

打开labelImg之前,先在labels文件夹下手动创建一个classes.txt文件,里面写上你的类别名称,防止labelImg的闪退。

  3、设置打开的图片文件夹,设置保存标签的文件夹,如下图

官方自带YOLOv5的半自动标注方法

   完成图片中1,2步后,第3步双击右侧图片,即可对框进行修改。

  4、打开自动保存功能,如下图

官方自带YOLOv5的半自动标注方法

 3、将所有标签微调好了后,下面是对数据进行划分。

   1、这里提供一个将数据划分为如下格式的脚本,也能用于v5的训练。图片如下

官方自带YOLOv5的半自动标注方法

   2、脚本如下:只需要改main函数中,文件路径、rate比列(训练集,验证集比列

import os
import random
import re
import shutil
def creat_files():
    try:
        shutil.rmtree('./data//images')
        shutil.rmtree('./data/labels')
    except:
        pass
    try:
        os.makedirs('./data/images/train')
        os.makedirs('./data/images/val')
        os.makedirs('./data/labels/train')
        os.makedirs('./data/labels/val')
    except:
        pass
def read_files(path):
    dir_list = os.listdir(path)
    for i in dir_list:
        #利用正则表达,切割出图片ID
        image_id = re.match(r'(.*)?.(jpg|png)',i).group(1)#图片后缀为jpg,png,可自行添加后缀格式
        labels_name = image_id+'.txt' #由图片ID找到对应标签名
        prob = random.randint(1, 100)#随机数prob
        if (prob < rate):  # train dataset
            old_images_path = path_images + '/' + i
            new_images_path = './data/images/train' + '/' + i
            old_labels_path = path_labels + '/'+ labels_name
            new_labels_path = './data/labels/train' + '/' + labels_name
            shutil.copy(old_images_path, new_images_path)
            shutil.copy(old_labels_path, new_labels_path)
        else:  # val dataset
            old_images_path = path_images + '/' + i
            new_images_path = './data/images/val' + '/' + i
            old_labels_path = path_labels + '/' + labels_name
            new_labels_path = './data/labels/val' + '/' + labels_name
            shutil.copy(old_images_path, new_images_path)
            shutil.copy(old_labels_path, new_labels_path)
if __name__ == '__main__':
    path_images = './images' #图片的路径
    path_labels = './labels' #标签路径
    rate = 90  # (1-100)之间,90即练集与验证集比例9:1,可以改成自己喜欢的比例
    creat_files()
    read_files(path_images)

   3、运行脚本会在代码根目录生成一个data文件,里面划分好数据,如下:

官方自带YOLOv5的半自动标注方法

    4、可以直接把这个data文件夹剪切到YOLOv5中进行训练了。