hf.py+voc_label.py,划分标签文件名后缀为txt的label

最新推荐文章于 2025-07-30 23:39:10 发布

浪迹天涯@wxy

最新推荐文章于 2025-07-30 23:39:10 发布

阅读量216

点赞数

CC 4.0 BY-SA版权

分类专栏：脚本之家文章标签： python 深度学习开发语言

本文链接：https://blog.csdn.net/wxy2020915/article/details/129128448

脚本之家专栏收录该内容

19 篇文章

订阅专栏

这两段代码分别用于数据集的划分和VOC格式的标签文件生成。hf.py将图像文件按比例划分为训练、验证和测试集，voc_label.py则创建对应图像集的标注文件，用于机器学习模型的训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述
hf.py

# -*- coding: utf-8 -*-
import os
import random
trainval_percent = 1
train_percent = 1
txtfilepath = 'labels'
txtsavepath = 'images'
total_txt = os.listdir(txtfilepath)
num = len(total_txt)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
ftrainval = open('hf_txt/trainval.txt', 'w')
ftest = open('hf_txt/test.txt', 'w')
ftrain = open('hf_txt/train.txt', 'w')
fval = open('hf_txt/val.txt', 'w')
for i in list:
    name = total_txt[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)
ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

voc_label.py

# -*- coding: utf-8 -*-

import xml.etree.ElementTree as ET
import os
from os import getcwd

sets = ['train', 'val', 'test']
classes = ["d00","d10","d20","d40"]
abs_path = os.getcwd()



wd = getcwd()
for image_set in sets:
    if not os.path.exists('labels/'):
        os.makedirs('labels/')
    image_ids = open('hf_txt/%s.txt' % (image_set)).read().strip().split()
    list_file = open('%s.txt' % (image_set), 'w')
    for image_id in image_ids:
        list_file.write(abs_path + '/images/%s.png\n' % (image_id))

    list_file.close()