面向机器学习的数据管道框架
fuel的Python项目详细描述
燃料
fuel为机器学习模型提供了它们需要学习的数据。
- 通用数据集的接口,如mnist、cifar-10(图像数据集)、google的十亿字(文本)等
- 以多种方式迭代数据的能力,例如在带有无序/顺序示例的小批量中
- 一种预处理器管道,允许您动态编辑数据,例如添加噪声、从句子中提取n个图形、从图像中提取补丁等。
- 确保整个管道可以用pickle序列化;这是检查点和恢复长期运行实验的要求。为此,我们非常依赖picklable_itertools库。
fuel主要由Blocks开发,这是一个帮助您训练神经网络的theano工具包。
如果您有问题,请毫不犹豫地写信给mailing list。
- 引用燃料
- 文档
- 有关详细信息,请参见documentation。
如果您在工作中使用积木或燃料,我们非常感谢您引用以下文章:
Bart van Merri_nboer,Dzmitry Bahdanau,Vincent Dumoulin,Dmitry Serdyuk,David Warde Farley,Jan Chorowski和Yoshua Bengio,“Blocks and Fuel: Frameworks for deep learning,^{EM1}$ARXIV预印本ARXIV:1506.00619[cs.lg],2015年。