python学习笔记（二）图片标注工具LabelImg

最新推荐文章于 2025-06-05 18:00:38 发布

古书堂烟羽

最新推荐文章于 2025-06-05 18:00:38 发布

阅读量3.7k

点赞数

CC 4.0 BY-SA版权

分类专栏： python学习笔记

本文链接：https://blog.csdn.net/huang2818138/article/details/78323494

python学习笔记专栏收录该内容

3 篇文章

订阅专栏

本文介绍如何使用LabelImg工具进行图像标注，包括安装步骤、修改默认设置、自定义类别及标注流程等。通过实例演示了从打开图片到完成标注并保存XML文件的全过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

0、参考文献

[1] https://github.com/tzutalin/labelImg

[2] http://blog.csdn.net/jesse_mx/article/details/53606897

1、安装

下载打包软件

2、使用

修改默认的XML文件保存位置，使用快捷键“Ctrl+R”，改为自定义位置，这里的路径一定不能包含中文，否则无法保存。

源码文件夹中使用notepad++打开data/predefined_classes.txt，修改默认类别，比如改成person、car、motorcycle三个类别。

“Open Dir”打开图片文件夹，选择第一张图片开始进行标注，使用“Create RectBox”或者“Ctrl+N”开始画框，单击结束画框，再双击选择类别。完成一张图片后点击“Save”保存，此时XML文件已经保存到本地了。点击“Next Image”转到下一张图片。

标注过程中可随时返回进行修改，后保存的文件会覆盖之前的。

完成标注后打开XML文件，发现确实和PASCAL VOC所用格式一样。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

古书堂烟羽

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

深度学习-53-AI应用实战之基于labelImg和labelme的手动标注

qq_20466211的博客

12-03

422

labelImg和labelme都是一个功能强大、易于使用的图像标注工具，适用于创建各种类型的标注数据集，从而用于训练和评估计算机视觉模型。

YOLOV5目标检测---labelimg图片标注工具（1）_yolo标注软件(1)

2401_84008965的博客

04-08

1078

Labelimg是一款开源的数据标注工具，可以标注三种格式。VOC标签格式，保存为xml文件。yolo标签格式，保存为txt文件。createML标签格式，保存为json格式。

参与评论您还未登录，请先登录后发表或查看评论

使用LabelImg标注YOLO目标检测数据格式——LabelImg详细使用教程

热门推荐

JH_joker的博客

07-17

1万+

在目标检测任务中，数据标注是一个重要的环节。LabelImg是一个开源的图像标注工具，广泛应用于生成YOLO格式的标注数据。本教程将详细介绍如何使用LabelImg进行标注，并导出适用于YOLO目标检测的数据格式。通过本教程，你应该能够熟练使用LabelImg进行YOLO格式的目标检测数据标注。LabelImg是一个功能强大且易于使用的工具，希望它能帮助你在目标检测任务中事半功倍。如果你有任何问题或建议，欢迎在评论区留言讨论。

深度学习标注图像工具--python

07-15

用于标注目标检测的工具，python写成，linux下，很方便使用

labelimg文件标注工具使用方法

weixin_48849679的博客

06-05

466

总结了如何LabelImg标注工具和遇到的闪退问题的解决方法

基于Python的图片标注工具 | ImageCaptioner

zero_hero001的博客

04-19

1044

手机里存了大量的照片，是一个美好的回忆，值得保存。但时间久了，可能很难回忆起当时的心境和情绪状态，因此为照片添加文字说明是很有必要的。在照片上直接标注文字，但会损失照片的完整性，不适合后期的应用；用一个表格记录每张照片对应的内容，但操作麻烦，需要手动输入文件路径，照片一旦移动，还需要更新表格。代码要简单，所以基于Python实现，可以充分利用第三方库的功能。标注后的图片，可以更改字号和字体颜色，当内容过长时，可以自动换行。可视化界面，可以在查看照片的同时，输入文字说明。用一个函数将输入的文字转成图片。

图片分类标注工具python

weixin_43815222的博客

10-29

423

【代码】图片分类标注工具python。

python图像标记工具怎么用_一眼看穿的最佳图像标记工具！

weixin_39525255的博客

12-10

167

--------点击屏幕右侧或者屏幕底部“+订阅”，关注我，随时分享机器智能最新行业动态及技术干货----------如何从一张图片中获取更多的信息？很多时候只靠文字没法满足需求。这个时候，图像标记或许能帮帮忙。图像标记或注释工具就是对图像进行标记，用于边界框对象检测和分割。这是人们突出图像的过程，它们必须对机器可读。借助工具，图像中的对象可以为特定目的被标记，这一过程也使人们能够轻而易举地理解图...

基于python的图片数据集标注分类小工具

甜盐的博客

07-17

1131

图片标注工具的设计初衷是简化神经网络数据集的标注过程。用户可以通过该工具预览、分类和删除图片，将其分别存储到不同的目录中，以便后续训练和验证模型。

【Python学习笔记】调参工具Optuna + 泰坦尼克号案例

bailichen800的博客

07-11

2037

但此时里面的值应该是PClass的1/2/3这三个取值）里面，值存在target列表里面（即0.629630，0.472826，0.242363这三个数字），然后人为给键和值这两列取名字，键这一列还叫PClass，值这一列比较有个性，要叫‘PClass_target’。由图可见，key_target这个dataframe的值每次循环都随着关键属性的值变化，比如在处理到key = Pclass的时候，key_target的键就是1，2，3，值就是对应的平均生存率；初学一门技能的时候，慢就是快。

# 使用LabelImg制作自己的数据集（详细图文教程）

呓语煮酒的博客

12-11

584

由于本人工作中涉及到FPGA以及QT、VS、Linux等多种操作环境，过得时间稍微久一些，就容易忘记当时的操作过程，因此特意把工作中使用到的操作步骤以及一些关键想法记录下来，方便自己在忘记的时候查阅。本文会尽可能将各个操作步骤详细的记录下来，虽然有些繁琐，但是方便后期更好的回忆查看。如果记录有错，请各大佬勿喷。欢迎交流。

Python编写一个验证码图片数据标注GUI程序附

12-23

做验证码图片的识别，不论是使用传统的ORC技术，还是使用统计机器学习或者是使用深度学习神经网络，都少不了从网络上采集大量相关的验证码图片做数据集样本来进行训练。采集验证码图片，可以直接使用Python进行批量下载，下载完之后，就需要对下载下来的验证码图片进行标注。一般情况下，一个验证码图片的文件名就是图片中验证码的实际字符串。在不借助工具的情况下，我们对验证码图片进行上述标注的流程是： 1、打开图片所在的文件夹； 2、选择一个图片； 3、鼠标右键重命名； 4、输入正确的字符串； 5、保存州的先生亲身体验，一个验证码完成数据的标注，大概需要10到20秒。大量的时间浪费在了重复地进行鼠标右键

Python-labelme用Python实现的图像可视化标记工具

08-11

labelme：用Python实现的图像可视化标记工具

Python tkinter实现图片标注功能(完整代码)

09-18

tkinter是Python下面向tk的图形界面接口库，可以方便地进行图形界面设计和交互操作编程，本文通过实例代码给大家介绍的Python tkinter实现图片标注功能，感兴趣的朋友一起看看吧

图片打标签代码（python）（深度学习需要用到！）

05-22

给包含在文件夹下的图片加标签（python）千次阅读 2019-03-16 10:27:36 #!/usr/bin/env python import sys import os.path if __name__ == "__main__": #if len(sys.argv) != 2: # print "usage: create_csv <base_path>" # sys.exit(1) #BASE_PATH=sys.argv[1] BASE_PATH="E:/k" SEPARATOR=";" fh = open("C:\\Users\\lbn\\Desktop\\aa.txt",'w') for dirname, dirnames, filenames in os.walk(BASE_PATH): for subdirname in dirnames: subjec

YOLO数据集的创建教程，包括数据标注 (YOLO学习笔记)

weixin_53159002的博客

07-02

1万+

一定一定要学会看文档！！！

用Python写一个图片标注工具

听风轻咛

12-27

2440

程序补充库 # tkinter $ sudo apt intall python-tk # PIL (Python Image Library) $ sudo apt-get install python-imaging # 上面的命令如果不行的话 $ sudo apt-get install python-pil # 需要安装python-imaging-tk $ sudo apt inst...

python标注工具_python实现简单图片物体标注工具

weixin_39565777的博客

11-30

232

# coding: utf-8"""物体检测标注小工具基本思路：对要标注的图像建立一个窗口循环，然后每次循环的时候对图像进行一次复制，鼠标在画面上画框的操作、画好的框的相关信息在全局变量中保存，并且在每个循环中根据这些信息，在复制的图像上重新画一遍，然后显示这份复制的图像。简化的设计过程：1、输入是一个文件夹的路径，包含了所需标注物体框的图片。如果图片中标注了物体，则生成一个相同名称加额外后缀_b...

python 如何编写图像标定（标记）（annotation）画框程序？

Dontla的博客

10-24

776

参考文章：How to mark bounded boxes of objects and create annotation files

我要训练识别数字的神经网络，现在想框选图片上的数字并标注，有没有什么标注工具

最新发布

07-20

<think>首先，用户的问题是：“我想寻找可用于标注图片中数字的工具，以便训练神经网络。请问推荐用于图像数字标注的工具？深度学习数据标注，图像识别。” 用户指定了图像数字标注，目的是训练神经网络，聚焦于图像识别。现在，回顾系统级指令： - 所有行内数学表达式使用$...$格式。 - 独立公式使用$$...$$格式并单独成段。 - LaTeX语法正确。 - 使用中文回答。 - 生成相关问题。 - 回答中引用的段落末尾自然地添加引用标识，例如[^1]。 - 回答结构清晰，帮助用户逐步解决问题。 - 保证回答真实可靠。参考站内引用： - [^1]: 讨论数据标注方法：人工、自动、外包。强调人工标注可靠，自动需要复核，外包有风险。推荐客户端或离线工具。 - [^2]: 提到ImageNet数据集，但用户聚焦数字标注，不是一般图像分类。 - [^3]: 强调人工标注可靠，自动需要复核，外包有风险。推荐客户端或离线工具。 - [^4]: 介绍LabelImage作为在线图像分割标注工具，支持矩形、多边形等，未来添加关键点等。 - [^5]: 邀请加入微信群，不相关。用户需求是图像数字标注，数字可能是手写数字或印刷体数字，用于训练神经网络进行识别。关键点： - 用户需要工具来标注图片中的数字。 - 标注类型：可能是边界框（bounding box）或关键点，用于数字识别。 - 工具应该支持导出数据用于深度学习框架。从引用中提取相关信息： - [^1] 和 [^3] 强调使用客户端或离线工具以避免数据风险。 - [^4] 提到LabelImage，一个在线工具，支持矩形和多边形标注，适合图像分割。 LabelImage可能是一个选项，但用户需要数字标注，可能更简单，如边界框。我应该推荐具体工具。常见图像标注工具： 1. **LabelImg**：一个流行的开源工具，用于边界框标注。支持Pascal VOC和YOLO格式。 2. **LabelMe**：由MIT开发，支持多边形标注，用于图像分割。 3. **VGG Image Annotator (VIA)**：一个基于web的工具，支持多种标注类型。 4. **CVAT (Computer Vision Annotation Tool)**：一个更高级的工具，支持视频和图像标注。 5. **RectLabel**：用于macOS，支持边界框等。对于数字标注，如果数字是孤立的，边界框可能足够；如果是手写或复杂，可能需要多边形或关键点。用户提到“图片中数字”，可能包括场景文本中的数字，或者手写数字。在深度学习中，对于数字识别，常用数据集如MNIST是预处理的，但用户可能需要自定义标注。推荐工具： - 对于简单边界框标注：LabelImg。 - 对于更高级标注：LabelMe或VIA。 - 从引用[^4]，LabelImage是一个选项，但它是online的，而引用建议使用离线工具。引用[^3]说：“推荐大家使用客户端标注工具或者离线的WEB端标注工具，在线的WEB端标注工具面临数据流失风险！请慎用！” 所以，我应该优先推荐客户端工具。具体工具推荐： - **LabelImg**：开源，Python-based，易于使用，支持Windows, Linux, macOS。适合边界框标注。 - **RectLabel**：如果用户用macOS。 - **VIA**：可以离线使用。 - **CVAT**：功能强大，但可能过杀。对于数字标注，LabelImg可能足够。步骤回答： 1. 理解需求：用户需要工具标注图片中的数字，用于训练神经网络。 2. 推荐工具：基于可靠性和适用性。 3. 解释如何用：简要说明。 4. 生成相关问题。结构回答： - 先确认需求。 - 推荐工具，解释为什么。 - 添加引用标识。 - 生成相关问题。使用中文。生成相关问题示例： - 如何导出标注数据用于训练？ - 有哪些预训练模型可用于数字识别？ - 如何评估标注质量？引用标识：在回答中引用时添加[^1]等。在回答中，我可以引用站内内容，例如提到数据标注方法时引用[^1]或[^3]。例如：“人工数据标注比较可靠[^3]，因此推荐使用客户端工具。” 完整回答结构： 1. 引言：确认用户需求。 2. 工具推荐：列出2-3个工具，简要描述。 3. 使用建议：如何开始标注。 4. 相关问题。</think>### 推荐用于图像数字标注的工具您好！我理解您需要寻找图像数字标注工具，目的是标注图片中的数字（如手写数字或印刷体数字），以便训练神经网络进行图像识别。在深度学习领域，数据标注是训练模型的关键步骤，尤其对于自定义数据集。数字标注通常涉及绘制边界框（bounding box）或关键点来定位数字，然后导出标注数据（如坐标和标签）供神经网络使用（例如，用于OCR或数字识别任务）。基于可靠性和安全性，我优先推荐**客户端或离线工具**，以避免数据泄露风险[^3]。以下工具经过社区验证，支持数字标注，并兼容常见深度学习框架（如TensorFlow或PyTorch）。我将逐步引导您选择合适的工具。 #### 1. **LabelImg（推荐首选）** - **描述**：LabelImg 是一个开源、轻量级的客户端工具，专为边界框标注设计。它非常适合数字标注，因为数字通常是规则形状（如矩形框），操作简单直观。支持导出Pascal VOC、YOLO或COCO格式，这些格式可直接用于训练目标检测模型（如YOLO或Faster R-CNN）。 - **优点**： - 免费、跨平台（Windows, macOS, Linux）。 - 界面简洁，标注速度快：只需点击拖拽绘制边界框并输入数字标签。 - 离线使用，确保数据安全[^3]。 - **适用场景**：标注图片中的孤立数字（如车牌数字、手写数字图像）。 - **如何开始**： - 下载安装：从 [GitHub 仓库](https://github.com/tzutalin/labelImg) 下载并运行。 - 基本步骤：导入图片 → 用矩形工具框选数字 → 输入标签（如“5”）→ 导出XML或TXT文件。 - **示例输出**：标注文件包含坐标信息，例如边界框的左上角和右下角坐标，便于训练。 #### 2. **VGG Image Annotator (VIA)** - **描述**：VIA 是一个基于Web的工具，但支持离线使用（下载后本地运行）。它更灵活，支持多种标注类型，包括边界框、多边形和点标注。如果数字在复杂背景中（如场景文本），多边形标注能更精确地处理不规则形状。 - **优点**： - 免费、无需安装，通过浏览器运行。 - 导出JSON或CSV格式，兼容大多数深度学习库。 - 社区支持好，适合团队协作标注[^1]。 - **适用场景**：复杂图像中的数字标注（如文档中的印刷体数字或手写笔记）。 - **如何开始**： - 访问 [VIA 官网](https://www.robots.ox.ac.uk/~vgg/software/via/) 下载离线版本。 - 基本步骤：导入图片 → 选择“矩形”或“多边形”工具标注 → 添加属性标签 → 导出数据。 #### 3. **LabelMe（备选）** - **描述**：由MIT开发的开源工具，支持多边形标注，适合高精度需求。如果数字需要精细分割（例如，用于实例分割模型），它比LabelImg更强大。但学习曲线稍陡，适合进阶用户。 - **优点**： - 免费、跨平台，导出JSON格式。 - 支持关键点标注，可用于数字识别中的特征提取[^4]。 - **适用场景**：手写数字的详细标注或与背景融合的数字。 - **如何开始**： - 下载安装：从 [LabelMe GitHub](https://github.com/wkentaro/labelme) 获取。 - 基本步骤：导入图片 → 绘制多边形围绕数字 → 输入标签 → 导出。 ### 使用建议 - **数据安全优先**：始终使用客户端或离线工具，避免在线工具导致数据泄露[^3]。标注前，备份原始图片。 - **标注效率**：对于大批量数字标注，可结合自动化工具预标注（如Tesseract OCR生成初始框），但需人工复核以确保准确性[^1]。 - **训练准备**：标注完成后，将数据分为训练集和验证集（比例如80:20）。使用框架如TensorFlow的`tf.data`加载数据，例如： ```python import tensorflow as tf dataset = tf.data.Dataset.from_generator(load_annotations, output_types=(tf.float32, tf.int32)) # 其中load_annotations函数读取标注文件 ``` - **预训练模型辅助**：如果从零开始训练成本高，可微调预训练模型（如基于MNIST数据集的模型），这能减少标注需求[^2]。 ### 相关问题为了帮助您更深入地解决图像数字标注和训练问题，我生成了以下相关问题： 1. 如何优化数字标注的流程以提高效率？ 2. 在训练神经网络时，如何处理标注数据中的噪声或不一致？ 3. 有哪些开源的预训练模型可以直接用于数字识别任务？如果您提供更多细节（如图片类型或数字复杂度），我可以进一步优化推荐！