监视HPC环境中作业资源的实用程序,尤其是OAR

colmet的Python项目详细描述


colmet-收集有关在分布式环境中运行的作业的度量

简介:
----


colmet是一个监视工具,用于收集有关在分布式环境中运行的作业的度量,特别是用于收集群集和网格上的度量。它目前提供了几个后端:
-taskstats:从linux内核获取任务度量
-stdout:在终端上显示度量
-zeromq:跨网络传输度量
-hdf5:在文件系统上存储度量

——

要求
~~~~~~~~~~~~~~


*支持
-taskstats

*python版本2.7或更高版本
-python zmq 2.2.0或更高版本
-python表3.3.0或更高版本
-python pyinotify 0.9.3-2或更高版本

~~~~~~~~~~~~

您可以使用以下命令安装、升级和卸载colmet::


$pip install[--user]colmet
$pip install[--user]--升级colmet
$pip uninstall colmet

或从git(最新开发版本)安装:

$pip install[--user]git+https://github.com/oar team/colmet.git

,或者如果您已经提取了源代码::


$pip install[--user]path/to/sources


>或者如果您没有pip::


$easy_install colmet


用法:
----


这些脚本中的(--help)

5.4
----


于2018年1月19日发布15

-从收集器中移除不必要的锁以避免colmet永远等待
-移除(异步)zmq eventloop并向收集器添加`--sample period`.
-修复了有关HDF文件的一些错误

0.5.2版
----


2015年4月2日发布修正了python语法错误


0.5.1版
----


2015年4月2日发布


-修正了sdist包中缺少"requirements.txt"文件的错误



0.5.0版
----

2015年4月2日发布

-不要将colmet作为守护进程已不再
-保持与zmq 3.x/4.x的兼容性
-删除了`--zeromq swap``(swap已从zmq 3.x中删除)
-处理了zmq名称从hwm更改为sndhwm和rcvhwm
-固定要求
-删除了python 2.6支持

0.4.0版-如果重新加载colmet以避免hdf5数据损坏,则将度量保存在新的hdf5文件中
-处理hup信号以重新加载colmet collector`
-删除了hiwater rss`和hiwater vm``收集的度量。



0.3.1版s``和`` hiwater_vm``用于taskstats
-使用pyinotify 0.8
-添加`--disable procstats``选项以禁用procstats后端。



0.3.0版
----

-将colmet包分成三部分

-colmet节点:从taskstats检索数据并procstats并发送到具有zeromq的收集器-colmet collector:存储数据的收集器zeromq在
hdf5文件中接收到
-colmet common:common colmet部分。
-添加了zeromq后端的一些参数以防止内存溢出
-简化了命令行接口
-由于尚未工作而丢弃了rrd后端或colmet定义colmet在将其推送到输出之前应在内存中排队的最大
计数器数
后端
-处理sigterm和sigint以正确终止colmet


0.2.0版
----

-添加了启用hdf5压缩的选项
-s支持按cgroup路径扫描的多个作业
-用于作业列表更新的inotify事件
-如果未指定作业id范围,则不筛选数据包,特别是使用zeromq
后端
-在扫描作业列表之前等待cgroup路径文件夹创建
-为节点添加procstat通过以0为标识符的虚拟作业进行监视
-使用绝对时间进行度量,而不是度量之间的延迟,以避免度量时间的
漂移
-在新的cgroup创建时,如果其中没有进程
(监视在启动一个进程之前暂停)



0.0.1版

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何定制springdata存储库方法名称?   html有没有办法将java应用程序或JApplet嵌入到网站中?   Jackson ObjectMapper将java从字符串序列化为JSON作为namevalue   java刷新JTable?   用Java程序分发用JavaDB制作的数据库   java Android如何启动新活动   当集合大小超过500.000时,java的处理速度会显著降低   在java的分层目录中的多个目录中查找相同的文件   java如何将ArrayList数据插入数据库   java如何修改此代码,使其时间复杂度为o(logn)或o(n),而不是o(n^2)   java面板(SimplePanel)中仅显示图像的前1/3(大约),   jakarta ee Java Bean和企业Java Bean之间的区别?   创建AWS Cloudfront自签名URL(java sdk)时出现amazon web服务错误   基于Jersey和Jackson查询参数的java动态属性过滤