读Java性能权威指南(第2版)笔记28_线程和同步性能中

发布时间 2023-03-26 08:01:25作者: 躺柒

1. 同步

1.1. 代码块对一组变量的访问看上去是串行的:每次只有一个线程可以访问内存

  • 1.1.1. 由synchronized关键字保护的代码块

  • 1.1.2. 用java.util.concurrent.lock.Lock类的实例保护的代码

  • 1.1.3. java.util.concurrent包中的代码

  • 1.1.4. java.util.concurrent.atomic包中的代码

    • 1.1.4.1. 原子类不使用同步,至少在CPU编程方面是这样

      1.1.4.1.1. 使用CAS指令的线程在同时访问同一资源时不会阻塞

    • 1.1.4.2. 原子类利用了比较并交换(Compare and Swap,CAS)CPU指令

    • 1.1.4.3. 包中的类使用了基于CAS的原语,而不是传统的同步

1.2. 同步的目的是保护对内存中值(或变量)的访问

1.3. 同步需要独占访问资源

  • 1.3.1. 需要同步锁的线程在另一个线程持有该资源时会阻塞

2. 同步的代价

2.1. 同步和可扩展性

  • 2.1.1. 应用程序在同步块中花费的时间会影响应用程序的可扩展性

  • 2.1.2. 阿姆达尔定律(Amdahl's law)

    • 2.1.2.1. 加速比=1÷((1-P)+P÷N)

    • 2.1.2.2. P是并行运行的程序量

    • 2.1.2.3. N是使用的线程数量

      2.1.2.3.1. 假设每个线程都有可用的CPU

    • 2.1.2.4. 随着P减小,也就是说,随着更多的代码位于串行块中,拥有多个线程的性能收益也会减少

2.2. 获取同步锁需要CPU周期

2.3. 获取同步锁的开销

  • 2.3.1. 如果锁是无竞争的,即两个线程没有在同一时间试图访问锁,那么这个开销是非常小的

    • 2.3.1.1. 非膨胀锁(uninflated lock)

      2.3.1.1.1. 无竞争的synchronized锁

      2.3.1.1.2. 获取一个非膨胀锁的开销在几百纳秒左右

    • 2.3.1.2. 无竞争的CAS结构会有更小的性能损失

  • 2.3.2. 有竞争的结构开销会更大

    • 2.3.2.1. 当第二个线程试图访问一个synchronized锁时,可以预见锁会变成膨胀的inflated

    • 2.3.2.2. 第二个线程必须等待第一个线程释放锁

    • 2.3.2.3. 这个等待时间取决于应用程序

  • 2.3.3. 在使用CAS指令的代码中,竞争操作的开销是不可预知的

    • 2.3.3.1. 在最坏的情况下,两个线程可能会陷入无限循环

      2.3.3.1.1. 因为每个线程修改CAS保护的值之后,发现另一个线程同时进行了修改

2.4. Java特有的,并取决于Java内存模型(Java Memory Model)

  • 2.4.1. 不同于C++和C这样的语言,它对关于同步的内存语义有严格的保证,并且该保证适用于基于CAS的保护、传统的同步,以及volatile关键字

  • 2.4.2. 变量会临时存储在寄存器中,这比直接在主内存中访问它们要高效得多

  • 2.4.3. 寄存器的值对其他线程来说是不可见的

  • 2.4.4. 修改寄存器中值的线程必须在某个时刻将该寄存器刷新到主内存中,这样其他线程才能看到这个值

  • 2.4.5. 什么时候刷新寄存器的值,是由线程同步决定的

  • 2.4.6. 对于标记为volatile的变量,无论什么时候被修改,都会被更新到主内存中

  • 2.4.7. 将大量连续的、细粒度的调用包装在一个同步块中

    • 2.4.7.1. 同步块执行时间很长就不适用

2.5. 同步的内存语义、基于CAS的结构,以及volatile关键字会对性能产生负面影响,特别是在有很多寄存器的大型机器上

3. 避免同步

3.1. 避免同步对象的竞争是减轻其性能影响的有效方法

  • 3.1.1. 在每个线程中使用不同的对象,这样访问对象时就不存在竞争了

3.2. 为了实现线程安全,很多Java对象是同步的,但它们未必需要共享

  • 3.2.1. 通过使用线程局部变量,对象的总数受到了限制(使对GC的影响最小化),而且每个对象都不会有线程竞争

  • 3.2.2. 线程局部变量永远都不会发生竞争,它们非常适合保存实际上不需要在线程间共享的同步对象

3.3. 用基于CAS的替代方案

  • 3.3.1. 在某种意义上,这并不能避免同步,而是以不同的方式解决问题

  • 3.3.2. 在这种情况下,通过减少同步的损失,可以得到与避免同步相同的效果

  • 3.3.3. 对于确实需要共享的对象,基于CAS的工具是一种避免传统同步的方法

3.4. 如果对资源的访问是无竞争的,基于CAS的保护会比传统的同步稍微快一些

3.5. 如果访问始终是无竞争的,完全无保护还会再快一些,并且可以避免边界情况

3.6. 如果对资源的访问存在轻度或者适度的竞争,基于CAS的保护会比传统的同步更快(通常会快得多)

3.7. 随着所访问资源的竞争越来越激烈,传统的同步将在某个时候成为更高效的选择

  • 3.7.1. 在实践中,这种情况只发生在运行了很多线程的大型机器上

3.8. 当只读取值而不写入的时候,基于CAS的保护不会受竞争的影响

3.9. 没有什么可以替代在代码运行的实际生产条件下进行广泛的测试,只有这样,才能确定某一特定方法的哪种实现更好

4. 伪共享

4.1. false sharing

4.2. 缓存行共享(cache line sharing)

4.3. 对于频繁修改volatile变量或退出同步块的代码,伪共享会显著降低性能

4.4. 伪共享造成的最严重的损失,基本上每个写操作都会使所有其他缓存行失效,而且性能是串行的

4.5. 伪共享不一定涉及同步(或volatile)变量,每当CPU缓存中的数据值被写入时,持有相同数据范围的其他缓存必须失效

4.6. Java内存模型要求,只有在同步原语(包括CAS结构和volatile)结束时,数据才必须写入主内存。所以这种情况是最常遇到的

4.7. 标准工具集中,没有任何一个可以解决伪共享,因为这需要与处理器架构相关的专业知识

  • 4.7.1. 某些原生分析器可以提供和给定代码行每条指令的时钟周期数(cycles per instruction,CPI)相关的信息

  • 4.7.2. 在一个循环内,某个简单指令的CPI很高,就表明代码正在等待将目标内存重加载到CPU缓存

4.8. 避免伪共享的主要方法是代码检查

4.9. 防止伪共享需要修改代码

  • 4.9.1. 理想的情况是,所涉及的变量可以不那么频繁地写入

    • 4.9.1.1. 极少的写入次数不太可能引起缓存行的竞争,即使4个线程在循环结束时同时更新结果,也不会对性能产生影响
  • 4.9.2. 对变量进行填充,这样它们就不会被加载到同一缓存行上

    • 4.9.2.1. 也可以使用填充来将冲突的变量移至不同的缓存行

4.10. 避免伪共享最好的方式是将数据移至局部变量,稍后再存储它们

5. @Contended注解

5.1. JDK私有类中的一个特性可以减少设定字段上的缓存竞争

5.2. 通过使用@sun.misc.Contended标记由JVM自动填充的变量来实现的

5.3. 这个注解是私有的

  • 5.3.1. 在Java 8中,它属于sun.misc包,没有什么能阻止你在自己的代码中使用这个包

  • 5.3.2. 在Java 11中,它属于jdk.internal.vm.annotation包,由于Java 11使用了模块系统

    • 5.3.2.1. 如果不用-add-exports标志将该包添加到java.base模块导出的类集中,就无法使用这个包编译类

5.4. -XX:+RestrictContended标志

  • 5.4.1. 默认是true

    • 5.4.1.1. 意味着该注解仅限于JDK的类使用

    • 5.4.1.2. JVM会忽略这个注解

  • 5.4.2. 要让应用程序代码使用该注解,需要加上-XX:-RestrictContended标志

5.5. -XX:-EnableContended

  • 5.5.1. 默认是true

    • 5.5.1.1. -XX:+EnableContended
  • 5.5.2. 禁用JDK的自动填充

    • 5.5.2.1. 这会减小Thread和ConcurrentHashMap类的大小,这两个类都使用这个注解来填充它们的实现,以防止伪共享