java意外的VarHandle性能（比备选方案慢4倍）

1 周，6 日 Questions & Answers 746

在JEP193中，VarHandles的一个具体目标是提供一种替代FieldUpdaters和AtomicIntegers的方法（并避免与之相关的一些开销）

AtomicIntegers在内存方面尤其浪费，因为它们是一个单独的对象（每个对象使用大约36字节，这取决于几个因素，例如是否启用压缩OOP等）

如果有许多整数可能需要进行原子更新（在许多小对象中），那么要减少浪费，基本上有三个选项：

使用AtomicFieldUpdater
使用VarHandle
或者重新排列代码，使用AtomicIntegerArray代替对象中的字段

因此，我决定测试这些备选方案，并了解它们对性能的影响

使用整数字段的原子（可变模式）增量作为代理，我在2014年年中的MacBook Pro上获得了以下结果：

Benchmark                         Mode  Cnt          Score          Error  Units
VarHandleBenchmark.atomic        thrpt    5  448041037.223 ± 36448840.301  ops/s
VarHandleBenchmark.atomicArray   thrpt    5  453785339.203 ± 64528885.282  ops/s
VarHandleBenchmark.fieldUpdater  thrpt    5  459802512.169 ± 52293792.737  ops/s
VarHandleBenchmark.varhandle     thrpt    5  136482396.440 ±  9439041.030  ops/s

在这个基准测试中，VarHandles的速度大约是的四倍

我想了解的是，开销从何而来

这是因为签名多态访问方法吗？我在微观基准测试中犯了错误吗

基准细节如下

我在2014年年中的MacBook Pro上用以下JVM运行了基准测试

> java -version
openjdk version "11.0.2" 2019-01-15
OpenJDK Runtime Environment AdoptOpenJDK (build 11.0.2+9)
OpenJDK 64-Bit Server VM AdoptOpenJDK (build 11.0.2+9, mixed mode)

基准测试的源代码：

import org.openjdk.jmh.annotations.Benchmark;
import org.openjdk.jmh.annotations.Fork;
import org.openjdk.jmh.annotations.Measurement;
import org.openjdk.jmh.annotations.Scope;
import org.openjdk.jmh.annotations.State;
import org.openjdk.jmh.annotations.Threads;
import org.openjdk.jmh.annotations.Warmup;
import org.openjdk.jmh.infra.Blackhole;

import java.lang.invoke.MethodHandles;
import java.lang.invoke.VarHandle;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.concurrent.atomic.AtomicIntegerArray;
import java.util.concurrent.atomic.AtomicIntegerFieldUpdater;

@State(Scope.Thread)
@Fork(value = 1, jvmArgs = {"-Xms256m", "-Xmx256m", "-XX:+UseG1GC"})
@Warmup(iterations = 3, time = 3)
@Measurement(iterations = 5, time = 5)
@Threads(4)
public class VarHandleBenchmark {

    // array option
    private final AtomicIntegerArray array = new AtomicIntegerArray(1);

    // vanilla AtomicInteger
    private final AtomicInteger counter = new AtomicInteger();

    // count field and its VarHandle
    private volatile int count;
    private static final VarHandle COUNT;

    // count2 field and its field updater
    private volatile int count2;
    private static final AtomicIntegerFieldUpdater<VarHandleBenchmark> COUNT2 ;

    static {
        try {

            COUNT = MethodHandles.lookup()
                    .findVarHandle(VarHandleBenchmark.class, "count", Integer.TYPE);
            COUNT2 = AtomicIntegerFieldUpdater.newUpdater(VarHandleBenchmark.class, "count2");
        } catch (ReflectiveOperationException e) {
            throw new AssertionError(e);
        }
    }

    @Benchmark
    public void atomic(Blackhole bh) {
        bh.consume(counter.getAndAdd(1));
    }

    @Benchmark
    public void atomicArray(Blackhole bh) {
        bh.consume(array.getAndAdd(0, 1));
    }

    @Benchmark
    public void varhandle(Blackhole bh) {
        bh.consume(COUNT.getAndAdd(this, 1));
    }

    @Benchmark
    public void fieldUpdater(Blackhole bh) {
        bh.consume(COUNT2.getAndAdd(this, 1));
    }
}

更新：应用apangin的解决方案后，以下是基准测试的结果：

Benchmark                         Mode  Cnt          Score          Error  Units
VarHandleBenchmark.atomic        thrpt    5  464045527.470 ± 42337922.645  ops/s
VarHandleBenchmark.atomicArray   thrpt    5  465700610.882 ± 18116770.557  ops/s
VarHandleBenchmark.fieldUpdater  thrpt    5  473968453.591 ± 49859839.498  ops/s
VarHandleBenchmark.varhandle     thrpt    5  429737922.796 ± 41629104.677  ops/s

差别消失了

共 (1) 个答案

# 1 楼答案
VarHandle.getAndAdd是一种signature polymorphic方法。也就是说，它的参数类型和返回值类型是从实际的源代码派生的

Blackhole.consume是一个重载方法。这种方法有多种变体：
- 消耗（整数）
- 消费（对象）
- 等等
在代码中，根据语言规则，使用了consume(Object)方法。因此，VarHandle还返回一个对象——一个装箱整数

为了使用正确的方法，您需要重写varhandle基准，如下所示：
```
bh.consume((int) COUNT.getAndAdd(this, 1));
```
现在varhandle将以与其他基准相同的性能运行

Python中文网

有 Java 编程相关的问题?

java意外的VarHandle性能（比备选方案慢4倍）

共 (1) 个答案

# 1 楼答案