java多线程1

2020-03-24 本文已影响0人呼噜噜睡

多线程是一个神奇的东西，难以捉摸，代码也不好理解。
为什么关注多线程呢？首先是面试经常被问到，然后是有很多并发工具类可以使用，如果理解不好，稀里糊涂的使用更可怕。所以，多线程就像是个大山，层层迷雾，我不得要领，然而每次受挫，下一回又继续。
我对于多线程的认识，来源有许多。一个是免费公开课，粗略的讲多线程，而我要傻傻的记住wait()方法是释放锁在哪里等待，sleep(arg)是持有锁在睡觉，还有很多要记。那岂不是每次使用都要来复习一遍，简直太可怕了。另一种就是收费课程，主讲并发包中的类，然后来上一通源码分析，各种CAS，队列，复杂的代码逻辑。这种课程，就像是水过了一遍沙子，没什么印象。第三种就是网上的知识片段了，有讲的很细的，比如synchronized这种锁，有很有优化机制，比如轻量级锁，偏向锁，重量级锁。以及随之而来的锁膨胀，偏向锁撤销等等，那种细节确实不错，但是在没有更大的上下文和知识的情况下，只能让人拜服多线程是多么复杂难懂。
但事情也许不该是这样的，我们不是设计虚拟机，也不会设计java的api。我们只是拿着现成的api和造好的工具来使用，何况还有各种最佳实践的体式，一切不该这么玄乎和复杂才对。
最近读了一本《Java并发编程的艺术》这本书，书本以简单和浅显的方式给我们说明了原理和应用，顿时觉得多线程不是那么不可逾越。下面文章的内容是这本书的摘抄，有兴趣的读着可以找原书来读。

多线程有啥好处和不好处这种就不说了。先说一下计算机的架构：
对于单个cpu，它是这样的，cup内部有各种寄存机和运算单元、控制单元，用于计算和暂存中间结果，与cpu很紧密相接的就是高速缓存，一级缓存，二级缓存，三级缓存等等，高速缓存连接着数据总线，数据总线连接着内存。对于多cpu来说，依然是每个cpu有自己的缓存或者某些cpu共用高速缓存。对于线程同步，就是发送一些指令，当cpu对数据写完之后，立即刷新到主存，其余的线程读数据的时候，一看是加锁的数据，就不从自己的缓存中读了，而从主存中读取最新的数据。因此关键就是弄一个机制保证数据的读写是有一定的顺序的，且是最新的。比如可以锁总线，在任意时刻，只能有一个线程操作内存中的某个数据，操作完立马写入内存，也可以通过锁定缓存，来保证数据是最新的。总之，这些都是计算机内部的协议，或者说是一些指令，jvm在代码执行的合适地方，插入这些指令，就实现了同步的效果。
然后说一下“内存可见性”，我总会读到这样的句子，当一个线程修改了变量，通过某种同步机制，这个修改对另一个线程是可见的。其实过程就是这个线程把某个变量修改后的值放入高速缓存，且通过一个指令，高速计算机要把这些变量立马同步到内存中。另一个线程如何可见呢？就是发现执行的代码中有类似loadload的指令，告诉它不要从高速缓存中取该变量的值，而是要从内存中去取，这个过程简称为“另一个线程看到了最新的值”，或者线程可见。还有一个疑问是，如果之前的线程正在将要内存中写值，另一个线程已经开始读了，这怎么办？这种情况我们不要想太多，因为不论是计算机还是java内存模型，都规定了指令执行的一些顺序。即使后一个线程正要读，但是发现这个内存区域是有保护的，那么它要等之前的线程把值放入内存。总之，这些麻烦的，或者细碎的东西，在JMM,happens-before规则中已经做了明确的规定，简化我们的开发。

"在多线程并发编程中synchronized和volatile都扮演着重要的角色，volatile是轻量级的同步，它在多处理器开发中保证了共享变量的“可见性”。可见性的意思是当一个线程修改一个共享变量时，另外一个线程能读到这个修改的值。如果volatile变量修饰符使用恰当的话，它比synchronized的使用和执行成本更低，因为它不会引起线程上下文的切换和调度"。
不同的是volatile仅针对单个变量，但synchronized确可以针对代码块，方法等更大范围的同步。

volatile是通过内存屏障指令来实现的，比如立马将数据写入内存，从内存中读取数据等等。

“代码块同步是使用monitorenter和monitorexit指令实现的，而方法同步是使用另外一种方式实现的，细节在JVM规范里并没有详细说明。但是，方法的同步同样可以使用这两个指令来实现。”
"monitorenter指令是在编译后插入到同步代码块的开始位置，而monitorexit是插入到方法结束处和异常处，JVM要保证每个monitorenter必须有对应的monitorexit与之配对。任何对象都有一个monitor与之关联，当且一个monitor被持有后，它将处于锁定状态。线程执行到monitorenter
指令时，将会尝试获取对象所对应的monitor的所有权，即尝试获得对象的锁"。
CAS:比较并交换，对应的硬件层面有与之对应的指令，比较当前线程栈上的变量值和从内存中取出的变量值是否一致，如果一致就说明没有其余线程进行修改，那么可以将该变量值的值修改为指定的新值。这个比较并且修改成新值是一个原子操作，由硬件支持的。
synchronized用的锁是存在Java对象头里的,具体来说是对象头里面的MarkWord中。对象头是什么呢？其实就是一种数据结构，存放class元信息，MarkWord等信息。Mark Word里默认存储对象的HashCode、分代年龄和锁标记位。
"Java SE 1.6为了减少获得锁和释放锁带来的性能消耗，引入了“偏向锁”和“轻量级锁”，在Java SE 1.6中，锁一共有4种状态，级别从低到高依次是：无锁状态、偏向锁状态、轻量级锁状态和重量级锁状态，这几个状态会随着竞争情况逐渐升级。锁可以升级但不能降级，意味着偏向锁升级成轻量级锁后不能降级成偏向锁。这种锁升级却不能降级的策略，目的是为了提高获得锁和释放锁的效率"。

"当一个线程访问同步块并获取锁时，会在对象头和栈帧中的锁记录里存储锁偏向的线程ID，以后该线程在进入和退出同步块时不需要进行CAS操作来加锁和解锁，只需简单地测试一下对象头的Mark Word里是否存储着指向当前线程的偏向锁。如果测试成功，表示线程已经获得了锁。如果测试失败，则需要再测试一下Mark Word中偏向锁的标识是否设置成1（表示当前是偏向锁）：如果没有设置，则使用CAS竞争锁；如果设置了，则尝试使用CAS将对象头的偏向锁指向当前线程。偏向锁使用了一种等到竞争出现才释放锁的机制，所以当其他线程尝试竞争偏向锁时，持有偏向锁的线程才会释放锁。"
"线程在执行同步块之前，JVM会先在当前线程的栈桢中创建用于存储锁记录的空间，并将对象头中的Mark Word复制到锁记录中，官方称Displaced Mark Word。然后线程尝试使用CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功，当前线程获得锁，如果失败，表示其他线程竞争锁，当前线程便尝试使用自旋来获取锁"。
"轻量级解锁时，会使用原子的CAS操作将Displaced Mark Word替换回到对象头，如果成功，则表示没有竞争发生。如果失败，表示当前锁存在竞争，锁就会膨胀成重量级锁"。
"因为自旋会消耗CPU，为了避免无用的自旋（比如获得锁的线程被阻塞住了），一旦锁升级成重量级锁，就不会再恢复到轻量级锁状态。当锁处于这个状态下，其他线程试图获取锁时，都会被阻塞住，当持有锁的线程释放锁之后会唤醒这些线程，被唤醒的线程就会进行新一轮的夺锁之争"。

到这里，我们看到，保证原子性的方式有以下几种：
1 通过总线锁保证原子性；
2 通过缓存锁定来保证原子性。

Java中实现原子操作的方法：
1 使用循环CAS实现原子操作；
2 使用锁机制实现原子操作。

CAS的不足：
1 ABA问题;
2 循环时间长开销大;
3 只能保证一个共享变量的原子操作。

java多线程1

猜你喜欢

热点阅读