管道库

drain的Python项目详细描述


image0image1image2image4

drain是一个轻量级框架,用于在python中编写可复制的数据科学工作流。核心功能是:

  • 将python工作流(DAG)转换为可由类似于make的工具运行的步骤。
  • 透明地将一个步骤的结果作为输入传递给另一个步骤,使用诸如HDFjoblib等高效工具处理用户请求的任何缓存。
  • 启用工作流的简单parallel执行
  • 只执行那些基于时间戳(源代码和数据)和依赖关系确定为必要的步骤,实际上保证了结果和有效开发的可重复性

排水管的设计遵循以下原则:

  • simplicity:drain非常轻量级且易于使用。核心只是几百行代码在drain中编写的步骤以最小的开销执行,使drain工作流易于调试和管理。
  • 可重用性:drain利用成熟的工具drake来执行工作流。drain为数据科学工作流提供了一个步骤库,包括特征生成和选择、模型拟合和比较。
  • 一般性:实际上任何工作流都可以在drain中实现。内核是在考虑可扩展性的情况下编写的,因此新的存储后端和作业调度程序(例如)将易于合并。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Cassandra复制因子大于节点数   java J2EE JTA事务回滚不适用于OSE Glassfish 4.0(Build 89)   java spring安全预认证用户登录   org的java类文件。反应流。从RxJava编译示例时未找到Publisher?   java在使用dataFormat作为POJO通过Camel调用Web服务时无法设置SOAP标头   Javafx类的java静态实例   java如何防止一个部件在关闭时覆盖另一个部件的位置   sql server无法从我的java代码连接到数据库   java在JList(Swing)中显示带有的ArrayList   从Java中的CXF服务获取WSAddressing数据   使用资产文件夹进行java简单json解析(本地)   java LDAPException未绑定的无效凭据   JavaJSFspring部署到weblogic   JAVA中字符数组中的特定元素排列?   如果脚本位于不同的目录中,则ant不会使用exec标记运行Javashell脚本