批量作业提交和管理工具
kong-batch的Python项目详细描述
孔
这是干什么的?在
假设您在某处使用批处理集群来运行并行工作负载。正常情况下 您应该为每种类型的系统编写专用的提交代码,并使用 监视作业进度的相关shell命令。你怎么跟踪 乔布斯怎么了?你怎么知道哪个工作做了什么?在
使用kong,您可以将作业组织到folders(而不是磁盘上的实际文件夹), 不管你怎么想。孔可以跟踪工作状态和报告 他们给你一个干净和有组织的观点。你可以管理你的工作 在香港,杀死他们,重新提交,删除他们。孔也使事情正常化 比如你的工作可以在哪里找到暂存空间,把日志文件放在哪里 以及输出文件的存放位置。这是由一组环境变量完成的 在每个作业中都可用,而不考虑后端(称为driver):
variable name | value |
---|---|
KONG_JOB_ID | Kong-specific job ID (not the batch system one) |
KONG_JOB_OUTPUT_DIR | Where to put output files |
KONG_JOB_LOG_DIR | Where log files go |
KONG_JOB_NPROC | How many core your job can use |
KONG_JOB_SCRATCHDIR | scratch dir for the job |
您可以编写作业脚本,这些脚本大多不知道驱动程序是哪个 用于执行作业。有些事情仍然是特定于你的环境, 尤其是在实际的批处理系统之上实现的东西。这个 包括许可证、队列名称和任何其他特定配置。 Kong允许您通过配置或on提供这样的参数 逐项工作。在
接口
回复
Kong提供了一个类似命令行的程序。如果你跑了
- 项目
标签: