有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java CPU时间百分比算法问题

我创建了一个Java算法,用于将纳秒CPU时间使用率(通过JMX获得)转换为100%的百分比,但该算法存在问题。该算法给出的数字似乎大于100%,我认为这是由于多个可用处理器造成的,尽管代码应该对此进行分类。算法如下所示cpuTimeDiffNS是以纳秒为单位使用的CPU时间量,而periodMS是采样周期

public static final double getCPUPerc(long cpuTimeDiffNS, long periodMS) {
    if (periodMS == 0) return 0;
    double cpuTimeDiffMS = cpuTimeDiffNS / 1000000d;
    int procs = Runtime.getRuntime().availableProcessors();
    long availableTime = periodMS * procs;
    double perc = cpuTimeDiffMS / availableTime;
    return perc * 100d;
}

以下是数据采集的一些样本:

0
87.5
133.8288232
160.8231707
197.7896341
209.6036585
248.822774
274.3902439
267.9115854
271.3414634
277.1067759
283.1554878
272.1036585
279.4000734
283.9176829
283.5365854
275.9146341
282.4578033
278.9634146
261.0536937
254.6071775
286.662182
278.9634146
276.7245597
288.4908537
281.6933708
286.9664634
279.7822896
276.2957317
280.4878049
275.5335366
271.7557485
280.8689024
287.2689689
281.6933708
267.5097276
273.2469512
286.1735835
289.6341463
296.875
279.4000734
289.2530488
282.8400196
288.4908537
287.4266145
288.1097561
286.5853659
288.9554795
238.1207192
288.4908537
288.7063531
290.3963415
286.662182
277.4390244
290.4843444
281.6310976
271.7557485
272.8658537
283.2222358
250.7621951

编辑:根据请求,输入收集功能(您可能可以忽略此功能):

// returns CPU time in NS for a thread group (recursively)
public static long getCPUTime(ThreadGroup tg) {
    synchronized (TGLOCK) {
        int size;
        do {
            size = tg.enumerate(tgThreads, true);
            if (size <= tgThreads.length) continue;
            tgThreads = new Thread[size];
        } while (size > tgThreads.length);

        long totalTime = 0;
        for (int i = 0; i < size; i++) {
            totalTime += getCPUTime(tgThreads[i]);
        }
        return totalTime;
    }
}

public static long getCPUTime(Thread t) {
    return threadMXBean.getThreadCpuTime(t.getId());
}

public static ThreadGroup getRootThreadGroup() {
    // Find the root thread group
    ThreadGroup root = Thread.currentThread().getThreadGroup().getParent();
    while (root.getParent() != null) {
        root = root.getParent();
    }
    return root;
}

以及输入(同样,您可以忽略这一点):

    simCPUTimeNS     = getCPUTime(kks.getSimThreadGroup());
    appsCPUTimeNS    = getCPUTime(kks.getAppThreadGroup());
    lwjns3CPUTimeNS  = getCPUTime(kks.getKKSThreadGroup());
    simCoreCPUTimeNS = getCPUTime(kks.getSimThread());
    totalCPUTimeNS   = getCPUTime(getRootThreadGroup());

    simCPUTimeNSDiff  = simCPUTimeNS - lastSimCPUTimeNS;
    appsCPUTimeNSDiff = appsCPUTimeNS - lastAppsCPUTimeNS;
    lwjns3CPUTimeNSDiff = lwjns3CPUTimeNS - lastLwjns3CPUTimeNS;
    simCoreCPUTimeNSDiff = simCoreCPUTimeNS - lastSimCoreCPUTimeNS;
    totalCPUTimeNSDiff = totalCPUTimeNS - lastTotalCPUTimeNS;

    lastSimCPUTimeNS     = simCPUTimeNS;
    lastAppsCPUTimeNS    = appsCPUTimeNS;
    lastLwjns3CPUTimeNS  = lwjns3CPUTimeNS;
    lastSimCoreCPUTimeNS = simCoreCPUTimeNS;
    lastTotalCPUTimeNS   = totalCPUTimeNS;

    simCPUPerc     = getCPUPerc(simCPUTimeNSDiff, currDiffMS);
    appsCPUPerc    = getCPUPerc(appsCPUTimeNSDiff, currDiffMS);
    lwjns3CPUPerc  = getCPUPerc(lwjns3CPUTimeNSDiff, currDiffMS);
    simCoreCPUPerc = getCPUPerc(simCoreCPUTimeNSDiff, currDiffMS);
    totalCPUPerc   = getCPUPerc(totalCPUTimeNSDiff, currDiffMS);

为任何帮助干杯,我相信答案是显而易见的;)
克里斯


共 (2) 个答案

  1. # 1 楼答案

    因此,我们使用类似的代码来计算平均负载,并且(事实证明)代码中可能也存在一个bug。我们使用getAllThreadIds(),但它只返回“活动”线程,enumerate也会这样做。如果任何线程停止,那么总cpu时间可能会下降。我不认为这会导致数值超过100%

    对你的代码有几点评论:

    • 为什么是synchronized (TGLOCK)行?这是为了同步ThreadGroup对象吗
    • if (size <= tgThreads.length) continue;应该是break;。没有必要重复测试
    • enumerate返回数组中的线程数。这永远是<= tg.length,所以如果我准备好的话,数组永远不会增长。如果它确实返回了更大的大小,那么您将得到NPE,因为在while检查之前有tgThreads = new Thread[size];,这永远不会是真的
    • 你使用ThreadGroup有什么原因吗?我们使用的是不需要递归的以下函数:
      for (long id : threadMxBean.getAllThreadIds()) {
          long cpuTime = threadMxBean.getThreadCpuTime(id);
      

    希望这至少能有所帮助

  2. # 2 楼答案

    我运行的是一个时间扩展的JVM(5X的慢化),并且看起来我在调整时忘记了在^ {CD1>}(^ {CD2>})中的C++ JVM代码的一部分中展开。哎呀。它使用timeGetTime(),这是一个Windows时间函数。这就解释了