pascal-voc格式数据集的一些工具
pascal-voc-tools的Python项目详细描述
帕斯卡VOC工具
这个包包括一些关于pascal voc格式数据集的工具,如读xml、写xml、调整图像大小。
XmlReader
from pascal_voc_tools import XmlReader
>>> xml_path = './test.xml'
>>> reader = XmlReader(xml_path)
>>> ann_dict = reader.load()
som函数用于读取xml文件并获取其中的数据。
xmlwriter
from pascal_voc_tools import XmlWriter
>>> writer = XmlWriter(image_path, image_width, image_height, image_depth, database, segmented)
>>> writer.add_object(name, xmin, ymin, xmax, ymax, pose, truncated, difficult)
>>> writer.save(save_path)
实际上,如果您有一个dict,其格式与从xmlreader加载的dict相同,您可以简单地使用如下命令:
>>> writer = XmlWriter()
>>> writer.save(save_path, ann_dict)
数据集大小
from pascal_voc_tools import DatasetResize
>>> resizer = DatasetResize(root_voc_dir, save_voc_dir)
>>> resizer.resize_dataset_by_min_size(min_size)
>>> resizer.copy_imagesets() # if the file include
数据分割
from pascal_voc_tools import DataSplit
>>> spliter = DataSplit(root_dir)
>>> result = spliter.split_by_rate(test_rate)
>>> spliter.save(result)
从https://github.com/Paperspace/DataAugmentationForObjectDetection