参考:
JVM体系结构
JVM类型
HotSpot
1 | > java -version |
JVM架构图
灰色:线程私有,内存很小(kb),不存在垃圾回收(因为生命周期随线程生死)。
橘色:线程共享,存在垃圾回收,大部分垃圾回收都是收的堆。
类装载器ClassLoader
负责加载class文件,class文件在文件开头有特定的文件标示(cafe babe),将class文件字节码内容加载到内存中,并将这些内容转换成方法区中的运行时数据结构并且ClassLoader只负责class文件的加载,至于它是否可以运行,则由Execution Engine决定
ClassLoader类型
- 虚拟机自带的加载器
- 启动类加载器(Bootstrap)C++
- 扩展类加载器(Extension)Java
- 应用程序类加载器(AppClassLoader)Java也叫系统类加载器,加载当前应用的classpath的所有类
- 用户自定义加载器
- Java.lang.ClassLoader的子类,用户可以定制类的加载方式
这些加载器的使用场合?
1 | package com.mxx.jvm; |
双亲委派机制 沙箱安全机制
双亲委派机制:
一个类是如何找加载器的?
当一个类收到了类加载请求,他首先不会尝试自己去加载这个类,而是把这个请求委派给父类去完成,每一个层次类加载器都是如此,因此所有的加载请求都应该传送到启动类加载其中,只有当父类加载器反馈自己无法完成这个请求的时候(在它的加载路径下没有找到所需加载的Class),子类加载器才会尝试自己去加载。
采用双亲委派的一个好处是比如加载位于 rt.jar 包中的类 java.lang.Object,不管是哪个加载器加载这个类,最终都是委托给顶层的启动类加载器进行加载,这样就保证了使用不同的类加载器最终得到的都是同样一个 Object对象。
证明:
1 | public class String { |
即,你写的代码不能污染java源代码,
沙箱安全机制:
沙箱安全机制是由基于双亲委派机制上 采取的一种JVM的自我保护机制,假设你要写一个java.lang.String 的类,由于双亲委派机制的原理,此请求会先交给Bootstrap试图进行加载,但是Bootstrap在加载类时首先通过包和类名查找rt.jar中有没有该类,有则优先加载rt.jar包中的类,因此就保证了java的运行机制不会被破坏.
Execution Engine执行引擎
负责解释命令,提交操作系统执行。
Native Method Stack & Native Interface & native libraies
本地接口的作用是融合不同的编程语言为 Java 所用,它的初衷是融合 C/C++程序,Java 诞生的时候是 C/C++横行的时候,要想立足,必须有调用 C/C++程序,就在内存中专门开辟了一块区域处理标记为native的代码,它的具体做法是 Native Method Stack中登记 native方法,在Execution Engine 执行时加载native libraies。
目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理生产设备,在企业级应用中已经比较少见。因为现在的异构领域间的通信很发达(因此不用关心内部),比如可以使用 Socket通信,也可以使用Web Service等等
native方法举例
1 | new Thread().start(); |
PC寄存器
每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向下一条指令的地址,也即将要执行的指令代码),由执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不记。
这块内存区域很小,它是当前线程所执行的字节码的行号指示器,字节码解释器通过改变这个计数器的值来选取下一条需要执行的字节码指令。
如果执行的是一个Native方法,那这个计数器是空的。
用以完成分支、循环、跳转、异常处理、线程恢复等基础功能。不会发生内存溢出(OutOfMemory=OOM)错误。(占用很小,只是记个行号)
Method Area 方法区
供各线程共享的运行时内存区域。它存储了每一个类的结构信息(Xxx.class–>classLoader –>Xxx Class,这个Xxx Class就存在方法区里),例如运行时常量池(Runtime Constant Pool)、字段和方法数据、构造函数和普通方法的字节码内容。上面讲的是规范,在不同虚拟机里头实现是不一样的,最典型的就是永久代(PermGen space)和元空间(Metaspace)。
But
实例变量存在堆内存中,和方法区无关。
Stack栈
栈管运行,堆管存储。
栈也叫栈内存,主管Java程序的运行,是在线程创建时创建,它的生命期是跟随线程的生命期,线程结束栈内存也就释放,对于栈来说不存在垃圾回收问题,只要线程一结束该栈就Over,生命周期和线程一致,是线程私有的。8种基本类型的变量+对象的引用变量+实例方法都是在函数的栈内存中分配。
函数栈内存:
基本类型:int,long,float
引用变量:User = new User(); 等号左边叫引用变量
实例方法:user.eat()
Java方法 = 栈帧 (就是把方法压栈的意思)
栈存储什么?
栈帧中主要保存3 类数据:
本地变量(Local Variables):输入参数和输出参数以及方法内的变量;
栈操作(Operand Stack):记录出栈、入栈的操作;
栈帧数据(Frame Data):包括类文件、方法等等。
栈运行原理:
栈中的数据都是以栈帧(Stack Frame)的格式存在,栈帧是一个内存区块,是一个数据集,是一个有关方法(Method)和运行期数据的数据集,当一个方法A被调用时就产生了一个栈帧 F1,并被压入到栈中。
A方法又调用了 B方法,于是产生栈帧 F2 也被压入栈,
B方法又调用了 C方法,于是产生栈帧 F3 也被压入栈,
……
执行完毕后,先弹出F3栈帧,再弹出F2栈帧,再弹出F1栈帧……
遵循“先进后出”/“后进先出”原则。
每个方法执行的同时都会创建一个栈帧,用于存储局部变量表(方法内的参数)、操作数栈、动态链接、方法出口等信息,每一个方法从调用直至执行完毕的过程,就对应着一个栈帧在虚拟机中入栈到出栈的过程。栈的大小和具体JVM的实现有关,通常在256K~756K之间,与等于1Mb左右。
SOF(StackOverflowError)
1 | package com.mxx.jvm; |
这不是异常,属于错误
1 | java.lang.Object |
栈+堆+方法区的交互关系
User user = new User()
reference: 就是等号左边的引用user
referrence指向右边的实例对象,这个对象存在堆里。
实例对象里有指针,指向对象类型数据,这类型数据存在方法区里。
HotSpot是使用指针的方式来访问对象:
Java堆中会存放访问类元数据的地址(类结构信息),
reference存储的就直接是对象的地址
堆体系结构
堆结构简介
一个JVM实例只存在一个堆内存,堆内存的大小是可以调节的。类加载器读取了类文件后,需要把类、方法、常变量放到堆内存中,保存所有引用类型的真实信息,以方便执行器执行,堆内存分为三部分
一个JVM实例只存在一个堆内存,堆内存的大小是可以调节的。类加载器读取了类文件后,需要把类、方法、常变量放到堆内存中,保存所有引用类型的真实信息,以方便执行器执行。
堆内存逻辑上分为三部分:新生+养老+永久
物理上:新生+养老
字符串常量池
字符串虽然是引用类型,但传进方法是无法改变方法外部的值的。为什么?
因为存在字符串常量池
1 | public class StringTest { |
原理:
堆的new对象流程
new Book()是new在新生代伊甸园区
当伊甸园区用完,程序又需要创建对象,就会触发GC(或者叫YGC,Young GC)
YGC将伊甸园区中的不再被其他对象所引用的对象进行销毁
然后将伊甸园中的剩余对象移动到幸存 0区(S0区)
如果一直往伊甸园new对象,就造成幸存 0区也满了,再对该区进行垃圾回收,然后移动到 1 区。
那如果1 区也满了呢?再移动到养老区。
若养老区也满了,那么这个时候将产生MajorGC(FullGC,FGC),进行养老区的内存清理。
若养老区执行了Full GC之后发现依然无法进行对象的保存,就会产生OOM异常“OutOfMemoryError”。
如果出现java.lang.OutOfMemoryError: Java heap space异常,说明Java虚拟机的堆内存不够。原因有二:
(1)Java虚拟机的堆内存设置不够,可以通过参数-Xms、-Xmx来调整。
(2)代码中创建了大量大对象,并且长时间不能被垃圾收集器收集(存在被引用)。
堆参数调优
面试
面试高频考点在java栈和堆。其他几个结构需要浅层理解功能作用。
难记:*
- 什么是类加载器
- 装载器类型?
- 双亲委派机制?沙箱安全机制?
- native是什么东西?为什么有申明无实现?
- pc寄存器是什么?
- 方法区
- 栈是干嘛的?
- *函数的栈内存保存了哪些东西?
- *栈帧中主要保存什么数据?
- 栈运行原理?
- StackOverflowError是怎么发生的?
- 栈+堆+方法区的交互关系


