高效并发(一)

前言

       并发处理的广泛应用是使得Amdahl定律代替摩尔定律称为计算机性能发展源动力的根本原因,也是人类压榨计算机能力最有力的武器。

概述

       多任务处理在现代操作系统中几乎已是一项必备的功能了,许多情况下,让计算机同时去做几件事,只是处理器的运算能力太强大了,与通讯子系统差距太大,大部分时间花了在磁盘i/o,网络通讯和数据库访问。后来在主内存和处理器之间加入了高速缓冲区cache,java的内存模型也是参考那样的方式设计的如下图:

       线程间通信的步骤:首先,线程A把本地内存A中更新过的共享变量刷新到主内存中去。然后,线程B到主内存中去读取线程A之前已更新过的共享变量。

内存间的交互操作

       八种操作来完成:来完成一个变量从主内存拷贝到工作内存、以及工作内存同步回主内存之内。

  1. Lock(锁定):作用于主内存的变量,将主内存该变量标记成当前线程私有的,其他线程无法访问。
  2. Unlock(解锁):作用于主内存的变量,解除主内存中该变量的锁定状态,让他变成线程共享变量。
  3. Read(读取):作用于主内存的变量,将该变量读取到当前线程的工作内存中,以便进行load操作。
  4. Load(加载):作用于工作内存中的变量,将read获取到的变量载入工作内存的变量副本中。
  5. Use(使用):作用于工作内存中的变量,虚拟机执行引擎在执行字节码指令的时候,碰到了一个变量就会执行该操作,使用该变量。
  6. Assgin(赋值):作用于工作内存中的变量,虚拟机执行引擎在执行字节码指令的时候,碰到了变量赋值的指令就会执行该操作。
  7. Store(存储):作用于工作内存中的变量,将工作内存中的变量放入主内存,以便进行write操作。
  8. Write(写入):作用于主内存中的变量,将store得到的变量放入主内存的变量中。

       说明:如果要把一个变量从主内存复制到工作内存,那就要按顺序地执行read和load操作,如果要把变量从工作内存同步回主内存,就要按顺序的执行store和write操作。这两个操作必须按顺序执行,但是没有保证是连续执行,也就是说read与load之间、store与write之间是可插入其他指令的。除此之外,Java内存模型还规定了在执行上述八种基本操作时必须满足如下规则:

  1. 不允许read和load、store和write操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者从工作内存发起回写了但主内存不接受的情况。
  2. 不允许一个线程丢弃它的最近assign操作,即变量在工作内存中改变了之后必须把该变化同步回主内存。
  3. 不允许一个线程无原因的(没有发生过任何assign操作)把数据从线程的工作内存同步回主内存中。
  4. 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,就是对一个变量执行use和store之前必须先执行过了assign和load操作。
  5. 一个变量在同一个时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。
  6. 如果对一个变量执行lock操作,僵尸清空工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。
  7. 如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作,也不允许去unlock一个被其他线程锁定住的变量。
  8. 对一个变量执行unlock操作之前,必须先把此变量同步回主内存中。

volatile

       它有两个语义:

  1. 保证该变量对所以线程的可见性,但不是总能保证线程安全性,因为java的操作并非原子操作。
  2. 禁止指令重排序。指令重排序会干扰并发程序的执行。

       我们如何选择:volatile的效率是高于锁的,只是在写操作上因为防止重排序插入了内存屏障指令高于普通变量。我们重点放到只使用volatile是否就能满足我们的业务需求,而且对double和long类型变量我们一般不会用到,可能会读到半个变量。

       Java内存模型中对volatile变量定义的特殊规则:

  1. 在工作内存中,每次使用volatile变量前都必须从主内存中刷新最新的值,用于保证能看到其他线程对变量V所做的修改后的值。
  2. 在工作内存中,每次修改后的值都必须立刻同步回主内存中,用于保证其他线程可以看到自己对变量的修改。
  3. volatile修饰的变量不会被指令重排优化,保证代码的执行顺序与程序的顺序相同。

内存模型的特点

原子性

       由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write这六个,我们可以大致的认为基本数据类型的访问读写是具备原子性的(long和double除外)。Java代码中的同步块即synchronized关键字,因此在synchronized块之间的操作也具备原子性。内部是通过字节码指令monitorenter和monitorexit来实现。

可见性

       就是当一个线程修改了共享变量的值,其他线程能够立即得知这个修改。Java内存模型是通过在变量修改后将新值同步回主内存,在变量读取前从主内存刷新变量值。关键字synchronized和final也能保证可见性。首先同步块是因为对变量执行unlock操作之前,必须先把次变量同步回主内存中。而final关键字的可见性是指:被final修饰的字段在构造器中一旦被初始化完成,并且构造器没有把this指针传递出去,那么在其他线程中就能看见final字段的值。

有序性

       用synchronized和volatile关键字来保证线程操作之间的有序性。volatile本省就包含禁止指令重排序的语义,而synchronized则是因为:一个变量在同一时刻只允许一条线程对齐进行lock操作。这个规则决定了持有同一个锁的两个同步块只能串行的进入。

先行发生原则

  如果Java内存模型中所有的有序性都只靠volatile和synchronized来完成,那么有一些操作将会变得很啰嗦。java内存模型中的一个重点原则——先行发生原则(Happens-Before),使用这个原则作为依据,来指导你判断是否存在线程安全和竞争问题。

  1. 程序顺序规则:在程序中,如果A操作在B操作之前(比如A代码在B代码上面,或者由A程序调用B程序),那么在这个线程中,A操作将在B操作之前执行。
  2. 管理锁定规则:一个unlock操作先于后面对同一个锁的lock操作之前执行。
    volatile变量规则:对一个volatile变量的写操作必须在对该变量的读操作之前发生。
  3. 线程启动规则:线程的Thread.start()必须在该线程所有其他操作之前发生。
  4. 线程终止规则:线程中所有操作都先行发生于该线程的终止检测。可以通过Thread.join()方法结束、Thread.isAlive()的返回值判断线程是否终止。
  5. 线程中断规则:对线程interrupt()方法的调用必须在被中断线程的代码检测到interrupt调用之前执行。
  6. 对象终结规则:对象的初始化(构造函数的调用)必须在该对象的finalize()方法完成。
    传递性:如果A先行发生于B,B先行发生于C,那么A先行发生于C。

线程的实现

  主要有三种方式:使用内核线程KLT、用户线程UT、使用用户和轻量级进程LWP混合。操作系统支持怎么样的线程模型,很大程度决定了java采用何种线程实现方式,对于java程序的编码和运行来说是差异是透明的。

线程调度

  分为协同式和抢占式两种。

线程的状态

  分为以下几种:新建、运行、无限期等待、限期等待、阻塞、结束

说明

  文中出现的图片,文字描述有些来自互联网,但是出处无法考究,如果侵犯您的相关权益,请联系我,核实后我会马上加上转载说明。谢谢!