0%

object

1. 对象的创建过程

在语言层面上, 创建对象 (例如克隆, 反序列化) 通常仅仅是一个 new 关键字而已, 而在虚拟机中, 对象 (不包括数组和 Class 对象) 的创建又是一个怎样的过程呢?

虚拟机需要一条 new 指令时, 首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用, 并且检查这个符号引用代表的类是否已经加载, 解析和初始化过.
如果没有, 必须先执行相应的类加载过程.

在类加载检查通过后, 接下来虚拟机将为新生对象分配内存.
对象所需内存的大小在类加载完成后便可完全确定, 为对象分配空间的任务等同于把一块确定大小的内存从 Java 堆中划分出来.
假设 Java 堆中内存是绝对规整的, 所有用过的内存都放在一边, 空闲的内存放在另一边, 中间放着一个指针作为分界点的指示器, 那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离, 这种分配方式称为 指针碰撞 (Bump the Pointer).
如果 Java 堆中的内存并不是规整的, 已使用的内存和空闲的内存相互交错, 那就没有办法简单地进行指针碰撞了, 虚拟机就必须维护一个列表, 记录上哪些内存块是可用的, 在分配的时候从列表中找到一块足够大的空间划分给对象实例, 并更新列表上的记录, 这种分配方式称为 空闲列表 (Free List).
选择哪种分配方式由 Java 堆是否规整决定, 而 Java 堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定.
因此, 在使用 Serial, ParNew 等带 Compact 过程的收集器时, 系统采用的分配算法是指针碰撞, 而使用 CMS 这种基于 Mark-Sweep 算法的收集器时, 通常采用空闲列表.

除了如何划分可用空间之外, 还有另外一个需要考虑的问题是对象创建在虚拟机中是非常频繁的行为, 即使是仅仅修改一个指针所指向的位置, 在并发情况下也并不是线程安全的, 可能出现正在给对象 A 分配内存, 指针还没来得及修改, 对象 B 又同时使用了原来的指针来分配内存的情况.
解决这个问题有两种方案, 一种是堆分配内存空间的动作进行同步处理 – 实际上虚拟机采用 CAS 配置上失败重试的方式保证更新操作的原子性;
另外一种是把内存分配的动作按照线程划分在不同的空间之中进行, 即每个线程在 Java 堆中预先分配一小块内存, 称为 本地线程分配缓冲 (Thread Local Allocation Buffer, TLAB).
那个线程要分配内存, 就在哪个线程的 TLAB 上分配, 只有 TLAB 用完并分配新的 TLAB 时, 才需要同步锁定.
虚拟机是否使用 TLAB, 可以通过 -XX:+/-UseTLAB 参数来设定.

内存分配完成后, 虚拟机需要将分配到的内存空间都初始化为零值 (不包括对象头), 如果使用 TLAB, 这一工作过程也可以提前至 TLAB 分配时进行.
这一步操作保证了对象实例字段在 Java 代码中可以不赋初始值就直接使用, 程序能访问到这些字段的数据类型所对应的零值.

接下来, 虚拟机要对对象进行必要的设置, 例如这个对象是哪个类的实例, 如何才能找到类的元数据信息, 对象的哈希码, 对象的 GC 分代年龄等信息.
这些信息存放在对象的对象头 (Object Header) 之中.
根据虚拟机当前的运行状态的不同, 如是否用偏向锁等, 对象头会有不同的设置方式.

在上面工作都完成之后, 虚拟机的视角来看, 一个新的对象已经产生了, 产对 Java 程序的视角来看, 对象创建才刚刚开始 – init 方法还没执行, 执行 new 指令之后会接着执行 init 方法, 把对象按照程序员的意愿进行初始化, 这样一个真正可用的对象才算完全产生出来.

2. 对象的内存布局

// todo

3. 对象的访问定位

4. Object 包含的方法

  • hashCode()
    Hash 是散列的意思, 就是把任意长度的输入, 通过散列算法变换成固定长度的输出, 该输出就是散列值.关于散列值, 有以下几个关键结论:
    1. 如果散列表中存在和散列原始输入K相等的记录, 那么K必定在 f(K) 的存储位置上
    2. 不同关键字经过散列算法变换后可能得到同一个散列地址, 这种现象称为碰撞
    3. 如果两个Hash值不同(前提是同一 Hash 算法), 那么这两个Hash值对应的原始输入必定不同

HashCode 有以下几个关键点:

  1. HashCode 的存在主要是为了查找的快捷性, HashCode 是用来在散列存储结构中确定对象的存储地址的
  2. 如果两个对象 equals 相等, 那么这两个对象的 HashCode 一定也相同
  3. 如果对象的 equals 方法被重写, 那么对象的 HashCode 方法也尽量重写
  4. 如果两个对象的 HashCode 相同, 不代表两个对象就相同, 只能说明这两个对象在散列存储结构中, 存放于同一个位置
  • equals()

  • toString()

  • getClass()

  • finalize()

作用:

  • finalize()是Object的protected方法, 子类可以覆盖该方法以实现资源清理工作, GC在回收对象之前调用该方法.
  • finalize()与C中的析构函数不是对应的.C中的析构函数调用的时机是确定的(对象离开作用域或delete掉), 但Java中的finalize的调用具有不确定性
    问题:
  • 一些与finalize相关的方法, 由于一些致命的缺陷, 已经被废弃了, 如System.runFinalizersOnExit()方法, Runtime.runFinalizersOnExit()方法
  • System.gc()与System.runFinalization()方法增加了finalize方法执行的机会, 但不可盲目依赖它们
  • Java语言规范并不保证finalize方法会被及时地执行, 而且根本不会保证它们会被执行
  • finalize方法可能会带来性能问题.因为JVM通常在单独的低优先级线程中完成finalize的执行
  • 对象再生问题: finalize方法中, 可将待回收对象赋值给GC Roots可达的对象引用, 从而达到对象再生的目的
  • finalize方法至多由GC执行一次(用户当然可以手动调用对象的finalize方法, 但并不影响GC对finalize的行为)

流程:
当对象变成(GC Roots)不可达时, GC会判断该对象是否覆盖了finalize方法, 若未覆盖, 则直接将其回收.否则, 若对象未执行过finalize方法, 将其放入F-Queue队列, 由一低优先级线程执行该队列中对象的finalize方法.执行finalize方法完毕后, GC会再次判断该对象是否可达, 若不可达, 则进行回收, 否则, 对象"复活".
对象可由两种状态, 涉及到两类状态空间, 一是终结状态空间 F = {unfinalized, finalizable, finalized}; 二是可达状态空间 R = {reachable, finalizer-reachable, unreachable}.各状态含义如下:

  • unfinalized: 新建对象会先进入此状态, GC并未准备执行其finalize方法, 因为该对象是可达的
  • finalizable: 表示GC可对该对象执行finalize方法, GC已检测到该对象不可达.正如前面所述, GC通过F-Queue队列和一专用线程完成finalize的执行
  • finalized: 表示GC已经对该对象执行过finalize方法
  • reachable: 表示GC Roots引用可达
  • finalizer-reachable(f-reachable): 表示不是reachable, 但可通过某个finalizable对象可达
  • unreachable: 对象不可通过上面两种途径可达

状态变迁图:

变迁说明:

  1. 新建对象首先处于[reachable, unfinalized]状态(A)
  2. 随着程序的运行, 一些引用关系会消失, 导致状态变迁, 从reachable状态变迁到f-reachable(B, C, D)或unreachable(E, F)状态
  3. 若JVM检测到处于unfinalized状态的对象变成f-reachable或unreachable, JVM会将其标记为finalizable状态(G, H).若对象原处于[unreachable, unfinalized]状态, 则同时将其标记为f-reachable(H).
  4. 在某个时刻, JVM取出某个finalizable对象, 将其标记为finalized并在某个线程中执行其finalize方法.由于是在活动线程中引用了该对象, 该对象将变迁到(reachable, finalized)状态(K或J).该动作将影响某些其他对象从f-reachable状态重新回到reachable状态(L, M, N)
  5. 处于finalizable状态的对象不能同时是unreahable的, 由第4点可知, 将对象finalizable对象标记为finalized时会由某个线程执行该对象的finalize方法, 致使其变成reachable.这也是图中只有八个状态点的原因
  6. 程序员手动调用finalize方法并不会影响到上述内部标记的变化, 因此JVM只会至多调用finalize一次, 即使该对象"复活"也是如此.程序员手动调用多少次不影响JVM的行为
  7. 若JVM检测到finalized状态的对象变成unreachable, 回收其内存(I)
  8. 若对象并未覆盖finalize方法, JVM会进行优化, 直接回收对象(O)
  9. 注: System.runFinalizersOnExit()等方法可以使对象即使处于reachable状态, JVM仍对其执行finalize方法
  • wait()

  • notify()

  • notifyAll()