Python工作流设计模式

Question

我正在设计一个软件，但现在有点迷茫，不知道自己在做什么，同时又觉得自己在重复别人已经做过的事情。

我的情况是这样的：我正在设计一个科学工具，里面有一个互动的用户界面。用户的输入应该能引发视觉反馈（这很明显），有些反馈是直接的，比如编辑一个区域的形状，有些则是尽快给出反馈，而不影响用户的操作，比如在这个区域内解决一些偏微分方程。

如果我把所有需要执行的操作画成一个图，我会得到一个非常复杂的图，里面展示了很多可以并行处理和缓存/重用部分结果的机会。所以我主要想利用这种并行处理的方式（让选定的子任务在不同的进程中执行，结果自动被后续任务合并，后续任务在等待所有输入准备好时），而且只需要重新计算那些输入发生变化的部分。

pyutilib.workflow似乎是最接近我想要的东西，当然它并没有（看起来没有进行任何子进程处理）。这让我有点失望；虽然我不是软件工程师，但我觉得我并没有提出什么过分的要求。

另一个复杂的因素是我希望有紧密的用户界面集成，而其他科学工作流解决方案似乎并不支持这一点。例如，我想通过一个转换节点传递一个拖放事件以进行进一步处理。这个转换节点有两个输入；一个是仿射变换状态输入端口，另一个是知道如何处理它的点集类。如果仿射变换输入端口是“脏的”（等待其依赖项更新），事件应该被暂时搁置，直到它变得可用。但是当事件通过节点后，事件输入端口应该标记为已处理，这样当仿射变换因用户进一步输入而改变时，就不会再次触发。这只是我看到的许多问题中的一个例子，我没有看到任何地方对此进行讨论。或者当一个长时间运行的分叉-合并分支在处理之前的输入时接收到新输入，该怎么办。

所以我的问题是：你知道有哪些好的书籍或文章可以阅读关于工作流设计模式吗？还是说我在试图把一个方钉放进圆孔，而你知道一种完全不同的设计模式我应该了解？或者有没有一个Python包可以实现我想要的功能，不管它的宣传词是什么？

我在enthought.traits的基础上自己做了一个解决方案，但我对此也不是特别满意，因为感觉像是在粗糙地重复别人的工作。只是我在网上找不到任何现成的解决方案。

注意：我并不想要网页框架、图形工作流设计工具或任何特殊用途的工具。只想要一些概念上类似于pyutilib.workflow的东西，但包括文档和我可以使用的功能。

# # # 编辑：这是我在更多阅读和思考后得出的结论：

可以加在“工作流架构”上的需求太多样化，根本没有一种解决方案能适合所有情况。你想要与磁盘存储紧密集成，还是与网页框架紧密集成，或者需要异步处理，甚至混合自定义有限状态机逻辑来调度任务？这些都是有效的需求，但它们大多不兼容，或者会导致毫无意义的混合。

不过，并不是一切都失去了希望。寻找一个通用的工作流系统来解决任意问题，就像寻找一个通用的迭代器来解决你的自定义迭代问题。迭代器并不是主要为了可重用性；你不能用红黑树的迭代器来遍历你的张量。它们的强项在于关注点的清晰分离和统一接口的定义。

我想要的（并且已经开始自己编写；这将会很酷）看起来是这样的：它的基础是一个与实现无关的工作流声明迷你语言，基于装饰器和一些元魔法，将下面这样的语句转换成包含所有所需信息的工作流声明：

@composite_task(inputs(x=Int), outputs(z=Float))
class mycompositetask:
    @task(inputs(x=Int), outputs(y=Float))
    def mytask1(x):
        return outputs( y = x*2 )
    @task(inputs(x=Int, y=Float), outputs(z=Float))
    def mytask2(x, y):
        return outputs( z = x+y )
    mytask1.y = mytask2.y   #redundant, but for illustration; inputs/outputs matching in name and metadata autoconnect

装饰器返回的是一个任务/复合任务/工作流的声明类。除了类型约束外，其他所需的元数据也可以轻松添加到语法中。

现在这个简洁且符合Python风格的声明可以传递给一个工作流实例工厂，返回实际的工作流实例。这个声明语言相当通用，可能在不同的设计需求之间不需要太多变化，但这样的工作流实例化工厂完全取决于你的设计需求和想象力，除了提供/获取输入/输出的公共接口。

在最简单的情况下，我们会有这样的东西：

wf   = workflow_factory(mycompositetask)
wf.z = lambda result: print result   #register callback on z-output socket
wf.x = 1    #feed data into x input-socket

其中wf是一个简单的工作流实例，它只是在同一线程上将所有包含的函数体串联在一起，一旦所有输入都绑定。这是一个相当冗长的方式来串联两个函数，但它说明了这个想法，并且已经实现了将信息流的定义集中在一个地方，而不是分散在那些不想与之有任何关系的类中。

这大致就是我目前实现的功能，但这意味着我可以继续我的项目，并且在适当的时候我会添加对更复杂工作流实例工厂的支持。例如，我在考虑分析依赖图，以识别分叉和合并，并跟踪每个输入在工作流实例级别上产生的活动，以实现优雅的负载均衡和取消那些失去相关性的特定输入的影响，但仍然占用资源。

无论如何，我认为将工作流声明、接口定义和实例化实现分开的项目是值得努力的。一旦我有几个非平凡的工作流实例类型运行良好（我意识到我至少需要两个来完成我正在进行的项目*），我希望能找到时间将其作为一个公共项目发布，因为尽管工作流系统的设计需求多种多样，但有了这个基础，实施你自己的特定需求会简单得多。而且，与其有一个臃肿的工作流框架，不如围绕这样的核心发展出一个可以轻松替换的自定义解决方案的瑞士军刀。

*意识到我需要将代码拆分为两种不同的工作流实例类型，而不是试图将所有设计需求压缩到一个解决方案中，这让我心中的方钉和圆孔变成了两个完美互补的孔和钉。

并行处理任务调度视觉反馈工作流设计用户界面集成依赖图分析复合任务工作流声明语言

Python工作流设计模式

1 个回答

层次A：软件设计

层次B：重负担的智能层

编辑：作为对你编辑的回应

层次C - 抽象的极乐世界

编辑2

层次D - 我卡住了

撰写回答