首页分享制作用于图像语义分割训练的标签数据【图像分割】【labelme】

制作用于图像语义分割训练的标签数据【图像分割】【labelme】

来源：花匠小妙招时间：2024-12-17 22:32

制作用于图像语义分割训练的标签数据 *写在前面一、使用labelme制作json数据1、安装labelme2、利用labelme制作json数据二、将json数据转化为图像数据1、单个json数据2、多个json数据同时转换三、将每一个图像标签数据从对应文件夹中取出来四、其他一些在操作过程中会遇到的小问题和解决方法1、文件名称中带有中文括号，如何删除括号2、统一修改文件名称参考

*写在前面

读者您好！本文主要就如何制作用于图像语义分割网络训练的标签数据进行介绍，包括利用labelme制作json数据，再将json数据转换为图像标签等，同时也介绍了一些批量管理文件的小方法。由于这是我的第一篇技术博客，所以可能内容文笔不免令人吐槽，还烦请多提意见！

一、使用labelme制作json数据

1、安装labelme

用于图像语义分割的训练数据一般都需要对物体进行像素级的标记，我们采用labelme来实现这个操作。在这之前需要先对python进行安装并按如下在cmd中安装labelme：

// 首先打开cmd并进入相应的安装环境 activate pytorch //这里进入我一般使用的pytorch环境 pip install labelme 123

2、利用labelme制作json数据

安装好后再次进入终端中，启动labelme：

labelme 1

启动后的界面如下图所示：
labelme启动界面
视图左上角打开样本数据或样本所在文件夹：
在这里插入图片描述
在图像处点击右键选择标记工具，一般选择“Polygons”，然后就可以勾勒目标轮廓。轮廓一定要封闭，结束一个封闭轮廓的勾勒后会提醒你标记相应的标签类别（这里我选择勾勒了骨头，因此为“bone”）：

点击“ok”后即可形成json并及时保存（左边save）。

二、将json数据转化为图像数据

1、单个json数据

该情况很简单，直接进入json数据所在的文件夹，然后进入终端进行如下操作：

labelme_json_to_dataset <json文件名>.json 12、多个json数据同时转换

首先打开对应环境下".Libsite-packageslabelmecli"文件夹（我的是“C:ProgramDataAnaconda3envspytorch-gpuLibsite-packageslabelmecli”），将原有的json_to_dataset.py文件中代码替换为以下内容（或者重新建立该文件）：

import argparse import json import os import os.path as osp import warnings import PIL.Image import yaml from labelme import utils import base64 def main(): warnings.warn("This script is aimed to demonstrate how to convert then" "JSON file to a single image dataset, and not to handlen" "multiple JSON files to generate a real-use dataset.") parser = argparse.ArgumentParser() parser.add_argument('json_file') parser.add_argument('-o', '--out', default=None) args = parser.parse_args() json_file = args.json_file if args.out is None: out_dir = osp.basename(json_file).replace('.', '_') out_dir = osp.join(osp.dirname(json_file), out_dir) else: out_dir = args.out if not osp.exists(out_dir): os.mkdir(out_dir) count = os.listdir(json_file) for i in range(0, len(count)): path = os.path.join(json_file, count[i]) if os.path.isfile(path): data = json.load(open(path)) if data['imageData']: imageData = data['imageData'] else: imagePath = os.path.join(os.path.dirname(path), data['imagePath']) with open(imagePath, 'rb') as f: imageData = f.read() imageData = base64.b64encode(imageData).decode('utf-8') img = utils.img_b64_to_arr(imageData) label_name_to_value = {'_background_': 0} for shape in data['shapes']: label_name = shape['label'] if label_name in label_name_to_value: label_value = label_name_to_value[label_name] else: label_value = len(label_name_to_value) label_name_to_value[label_name] = label_value # label_values must be dense label_values, label_names = [], [] for ln, lv in sorted(label_name_to_value.items(), key=lambda x: x[1]): label_values.append(lv) label_names.append(ln) assert label_values == list(range(len(label_values))) lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value) captions = ['{}: {}'.format(lv, ln) for ln, lv in label_name_to_value.items()] lbl_viz = utils.draw_label(lbl, img, captions) out_dir = osp.basename(count[i]).replace('.', '_') out_dir = osp.join(osp.dirname(count[i]), out_dir) if not osp.exists(out_dir): os.mkdir(out_dir) PIL.Image.fromarray(img).save(osp.join(out_dir, 'img.png')) #PIL.Image.fromarray(lbl).save(osp.join(out_dir, 'label.png')) utils.lblsave(osp.join(out_dir, 'label.png'), lbl) PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir, 'label_viz.png')) with open(osp.join(out_dir, 'label_names.txt'), 'w') as f: for lbl_name in label_names: f.write(lbl_name + 'n') warnings.warn('info.yaml is being replaced by label_names.txt') info = dict(label_names=label_names) with open(osp.join(out_dir, 'info.yaml'), 'w') as f: yaml.safe_dump(info, f, default_flow_style=False) print('Saved to: %s' % out_dir) if __name__ == '__main__': main()

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586

然后进入到对应环境下的“Scripts”（我的是”C:ProgramDataAnaconda3envspytorch-gpuScripts“），进入终端后执行以下操作即可生成图像数据：

labelme_json_to_dataset.exe <json所在文件夹名> 1

但是这些文件均在“Scripts”文件夹下，记得将其取出。

三、将每一个图像标签数据从对应文件夹中取出来

比如目前我有10个经由json文件转化得来的图像标签数据文件夹（很可恶，一个json一个文件夹）。
在这里插入图片描述
创建如下python文件并运行即可将每个文件夹中所有标签数据取出来并按顺序命名且排列：

import os import random import shutil import re GT_from_PATH = "图像文件夹们的母文件夹名称" GT_to_PATH = "目标文件夹名称" filepath_list = os.listdir(GT_from_PATH) for i, file_path in enumerate(filepath_list): gt_path = "{}/{}_gt.png".format(os.path.join(GT_from_PATH, filepath_list[i]), file_path[:-5]) print("copy {} to ...".format(gt_path)) gt_name = ["label.png".format(file_path[:-5])] gt_file_path = os.path.join(GT_from_PATH, file_path) from_dir=gt_file_path to_dir= GT_to_PATH Name_list="bonelabel{}.png".format(i+1)#为输出图像命名 if not os.path.isdir(to_dir): os.mkdir(to_dir) try: if not os.path.isfile(os.path.join(from_dir, "label.png")): print("{} is not existed".format(os.path.join(from_dir, Name_list))) shutil.copy(os.path.join(from_dir, "label.png"), os.path.join(to_dir, Name_list)) except: pass print("{} has copied to {}".format(from_dir, to_dir))

1234567891011121314151617181920212223242526272829

结果如下，至此完成了图像标签数据从json文件制作到处理最终输出图像标签的全过程：
在这里插入图片描述

四、其他一些在操作过程中会遇到的小问题和解决方法

1、文件名称中带有中文括号，如何删除括号

问题如图，想要取除其中的中文括号（一般出现在你想要批量命名一堆文件时，全选后重命名相同内容就会出现这个效果）：
在这里插入图片描述
在所属文件夹下创建txt文件，并添加以下内容：

@Echo Off&SetLocal ENABLEDELAYEDEXPANSION FOR %%a in (*) do ( set "name=%%a" set "name=!name: (=!" set "name=!name:)=!" ren "%%a" "!name!" ) exit 12345678

保存后，重命名其后缀为.bat然后双击运行即可，效果如下：
在这里插入图片描述