脚本脚本(sos):用于可重复数据分析的交互式、跨平台和跨语言工作流系统
sos的Python项目详细描述
计算密集型学科,如计算生物学 需要一个来利用在不同编程中实现的各种工具 以及分析高性能计算系统上的大型数据集。 尽管科学的工作流系统在组织和执行方面很强大 大规模的数据分析过程中,通常会有不平凡的学习 创建和维护此类工作流的曲线和工程开销, 使它们不适合于数据探索和原型制作。架起 交互分析和工作流系统之间的差距,我们开发了脚本 脚本(SoS),一个高度强调可读性、实用性的系统, 以及日常计算研究的可重复性。用于探索性分析 sos提供了一个多语言文件格式和脚本引擎,集中 所有计算,并创建用于发布和 分享。作为一个工作流引擎,sos提供了一种直观的语法来创建 面向过程、面向结果和混合样式的工作流,以及 在各种计算上执行和管理任务的统一接口 具有独立系统之间文件自动同步的平台。 在这篇文章中,我们用实际的例子说明了sos作为 各阶段方法的交互分析工具和管道平台 开发和数据分析项目。我们特别演示了SOS 可以很容易地采用现有的脚本和管道,但结果 在组织性、可读性和 跨平台计算管理。
有关SOS的详细信息,请参阅http://vatlab.github.io/SOS/。