工业实力数据科学工具包
ares的Python项目详细描述
##家 基于流行的科学计算工具包,aresy的目标是使在单个服务器上处理大规模数据变得容易。aresy将整个数据流视为一个计算图,输入数据将放在占位符中,通过扩展该图,几乎可以执行任何基于python的转换。阿瑞西的设计原则如下:
- 兼容python数据科学生态系统,如numpy、pytorch、tensorflow模块。
- 能够同时处理跨类型、跨域、跨粒度的数据。
- 易于构建大型特征生成器、转换器甚至数据加载器,以便将预处理的数据馈送到深度学习模型中。
##安装 `shell python setup.py install `
##包装参考
- aresy.格式化
- aresy.formatting.tsvdataloader
- aresy.formatting.tsvplaceholder
- aresy.预处理
- aresy.preprocessing.wranglefloat
- aresy.preprocessing.wranglestr
- aresy.preprocessing.wranglenormaldatetime
- 累加
- aresy.aggregating.sum
- 平均值
- aresy.aggregating.std
- aresy.aggregating.max
- aresy.aggregating.min
- aresy.aggregating.quantile
- 实用程序
- aresy.wrap_输出到json