旨在简化数据处理以进行深度学习的轻量级包

melon的Python项目详细描述


build-statuscoverage-statuspypi-referencepypi-downloads

甜瓜

Melon是一个轻量级软件包,旨在简化数据处理以进行深入学习。
它消除了在(模型)训练、测试和推理之前对数据进行预处理的样板代码的需要。
它旨在标准化数据序列化和操作方法。

默认格式与框架(如tensorflow/pytorch/keras的需求保持一致
该工具还根据用例提供不同级别的定制。

安装

使用pip

安装和更新
$ pip install melon

在python中受支持>;=3.4.0

示例

图像

默认情况下options

frommelonimportImageReaderdeftrain():source_dir="resources/images"reader=ImageReader(source_dir)X,Y=reader.read()...withtf.Session()ass:s.run(...,feed_dict={X_placeholder:X,Y_placeholder:Y})
source_dir目录应包含需要读取的图像。参考sample directory
在示例目录中有一个可选的labels.txt文件,如Labeling所述。

由于图像的数量可能太大,无法装入内存,因此该工具支持批处理。

frommelonimportImageReaderdeftrain():source_dir="resources/images"options={"batch_size":32}reader=ImageReader(source_dir,options)whilereader.has_next():X,Y=reader.read()...
这将读取32批图像,直到读取所有图像。如果未指定batch_size,则reader.read()将读取所有图像。

自定义options

frommelonimportImageReaderdeftrain():source_dir="resources/images"options={"data_format":"channels_last","normalize":False}reader=ImageReader(source_dir,options)...
这会将数据格式更改为channels-last(每个示例都是Height x Width x Channel),并且不会规范化数据。有关可用选项,请参见options

选项

图像

width
Width of the output (pixels). default: ^{tt7}$
height
Height of the output (pixels). default: ^{tt7}$
batch_size
Batch size of each read. default: All images in a directory
data_format

Format of the images data

^{tt9}$ - Channel x Height x Width (default)
^{tt10}$ - Height x Width x Channel
标签格式 标签数据的格式
^{tt11}$ - as a matrix, with one-hot vector per image (default)
^{tt12}$ - as a vector, with a single label per image
规格化
规范化数据。默认值:True
num_threads-并行处理的线程数
默认值:机器的核心数

标记

在监督学习中,每个图像都需要映射到一个标签。
虽然该工具支持读取不带标签的图像(例如用于推断),但它也提供了一种标记图像的方法。

生成标签文件

要生成labels文件,请使用以下命令:
$ melon generate
> Source dir:
提供源目录后,工具将在该目录中生成带有空白标签的labels文件。
最后一步是为生成的文件中的每一行添加一个标签。

参考见sample labels
#legend
pedestrian:0
cat:1
parrot:2
car:3
apple tree:4

#map
img275.jpg:1
img324.jpg:2
img551.jpg:3
img928.jpg:1
img999.png:0
img736.png:4
#legend节是可选的,但是#map节是将标签映射到图像所必需的。

标签格式

标签的输出格式可以在Custom options中指定。它默认为one-hot格式。

路线图

  • 支持视频数据(2019年第1季度)
  • 支持阅读AWS S3(2019年第2季度)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何修复使用高停止条件时的StackOverflowerError   java两个非常好的int被除掉,仍然返回0   java将SpringWeb应用程序(Web.xml)迁移到Springboot 1.5.10   java使用CQL查询的结果集检索整行   java Solr 7:当某些请求命中Solr时,QueuedThreadPool线程数很高   在ActionListener中访问另一个类时发生java NullPointerException   异常处理Java重构类似方法的代码   java Hi我需要帮助在我的JSP页面中传输图像   Android中的java工作线程   覆盖字段值的JavaDB模型策略   带有resteasy的java Spring引导“找不到名为requestMappingHandlerMapping的bean的类型”错误   java如何插入(int)和(date)类型?   Java Swing计时器和ActionEvent   java运行一个没有jUnit作为运行选项的类   java通过解析异常来获取方法名及其包含的参数   与枚举匹配的java Get-from列表元素   我的程序中出现java内存不足错误   java在C中创建jobject不起作用   如何在java中测试这个void方法?