Java对象的内存模型
众所周知,函数调用在内存中是通过压栈,退栈实现的,而Java的方法调用则是在JVM栈中通过栈帧实现的,且所有的Java对象都只在堆上分配内 存.那么一个Java对象在堆内存里到底长啥样呢?实际上,当一个对象在内存中被创建的时候,它只不过是一串0和1而已.编译器会维护一张表,这张表用来 存储对象中的每一个成员变量所在位置的偏移量(offset).这样,通过查这张表,JVM就能知道每一个成员变量相对于其起始地址所在的位置了.
来看这样一个例子.我们定义一个名为 Base 的类,它没有任何的成员方法,只有两个成员变量x和y.Base 对象的内存模型如下图所示:
然后我们从Base类派生一个名为 Derived 的子类,则 Derived 对象的内存模型如下:
可以看到,子类的内存模型实际上就是在父类的基础上添加了子类特有的成员变量而已.这样设计的好处是,如果有一个 Base 类型的引用指向了 Derived 对象,那么由于 Derived对象的内存模型中包含了其父类 Base,因而 Base 类对于其子类 Derived 是可见的. 这样一来,任何通过Base引用操作 Derived 对象的调用都是安全的.
啥叫安全呢?例如上面这个例子,编译器会维护一张保存有成员变量offset的表,这张表是这么写的:x变量在第1个位置,y变量在第2个位置,z 变量在第3个位置.(当然实际中肯定不是第几个位置这么简单,编译器会根据变量的数据类型确定其offset,如,一个int偏移4字节,一个 double偏移8字节).当我们通过Base引用来引用Derived中的成员时,编译器就会去找这个对象中的第几个位置.比如调用derived.x 会去找第一个位置,derived.z,则会去找第三个位置.因为子类Derived中包含了父类的x,y变量,而且次序正好排在x,y之后,所以derived.z可以被成功执行.
按照这个逻辑,方法也可以放在每个对象的起始位置:
不过,这么干是非常低效的.如果一个类有很多的方法,那么就要在起始位置保存大量的数据,并且每个对象都会重复地保存这些函数代码.这样对象构造起来就慢,造成空间和时间上的性能浪费.
解决这个问题的一个办法是,为每一个类创建一个虚表(virtual table),这张表里保存了这个类中所有的方法代码.而对于这个类的对象,则在其内存的起始位置中保存一个指向此表的指针.这样一来,多个对象就能共享一份方法代码了.
英文原文:http://www.programcreek.com/2011/11/what-do-java-objects-look-like-in-memory/