管道库

drain的Python项目详细描述


image0image1image2image4

drain是一个轻量级框架,用于在python中编写可复制的数据科学工作流。核心功能是:

  • 将python工作流(DAG)转换为可由类似于make的工具运行的步骤。
  • 透明地将一个步骤的结果作为输入传递给另一个步骤,使用诸如HDFjoblib等高效工具处理用户请求的任何缓存。
  • 启用工作流的简单parallel执行
  • 只执行那些基于时间戳(源代码和数据)和依赖关系确定为必要的步骤,实际上保证了结果和有效开发的可重复性

排水管的设计遵循以下原则:

  • simplicity:drain非常轻量级且易于使用。核心只是几百行代码在drain中编写的步骤以最小的开销执行,使drain工作流易于调试和管理。
  • 可重用性:drain利用成熟的工具drake来执行工作流。drain为数据科学工作流提供了一个步骤库,包括特征生成和选择、模型拟合和比较。
  • 一般性:实际上任何工作流都可以在drain中实现。内核是在考虑可扩展性的情况下编写的,因此新的存储后端和作业调度程序(例如)将易于合并。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java关闭应用程序按钮Listener   Java中的多线程同步在Java示例中的思考   java如何查看Tomcat正在使用/访问的JAR?   java My代码在调用垃圾收集器后不会终止   多线程Java连接线程池和connectionfactory?   java在运行时修改JAR文件   java Android:使用光标时引发IllegaleException   在Netbeans中测试不可执行库的java?   泛型在参数上强制子类Java类型   spring Java:继承与依赖注入“自动连线”   javascript如何解析这个xml元素   java打印特定序列中的数组   带有ProcessingTimeSessionWindow的java Apache Flink自定义触发器   java如何配置消息驱动的Bean应用程序和Glassfish来使用来自远程MessageBroker的消息?