你必须明白的新生代垃圾回收:YoungGC

关注公众号:Java架构师联盟,每日更新技术好文算法

Young GC

前文提到,Young GC(如下简称YGC)是指新生代垃圾回收,下面将详细讨论G1的YGC过程。架构

选择CSetoop

YGC的回收过程位于 G1CollectedHeap::do_collection_pause_at_safepoint(),在进行垃圾回收前它会建立一个清理集CSet(Collection Set),存放须要被清理的Region。选择合适的Region放入CSet是为了让G1达到用户指望的合理的停顿时间。CSet的建立过程如代码清单11-2所示:spa

代码清单11-2 选择Region放入CSet线程

void G1Policy::finalize_collection_set(...) {
// 先选择新生代Region,用户指望的最大停顿时间是target_pause_time_ms
// G1计算出清理新生代Region的可能用时后,会将剩下的时间(time_remaining_ms)给老年代
double time_remaining_ms =
_collection_set->finalize_young_part(...);
_collection_set->finalize_old_part(time_remaining_ms);
}

G1的YGC只负责清理新生代Region,所以finalize_old_part()不会选择任何Region,因此只须要关注finalize_young_part()。finalize_young_part会在将全部Eden和Survivor Region加入CSet后准备垃圾回收。code

G1在evacuate_collect_set()中建立G1ParTask,而后阻塞,直到G1ParTask执行完成,这意味着整个YGC期间应用程序是STW的。相似Parallel GC的YGC,G1ParTask的执行由线程组GangWorker完成,以尽可能减小STW时间。不难看出,YGC的实际工做位于G1ParTask,它主要分为三个阶段:对象

1)清理根集( G1RootProcessor::evacuate_roots);队列

2)处理RSet( G1RemSet::oops_into_collection_set_do);rem

3)对象复制( G1ParEvacuateFollowersClosure::do_void)。get

清理根集

第一阶段是清理根集。第10章提到HotSpot VM不少地方都属于GCRoot,G1ParTask的evacuate_roots()会从这些GC Root出发寻找存活对象。以线程栈为例,G1会扫描虚拟机全部JavaThread和VMThread的线程栈中的每个栈帧,找到其中的对象引用,并对它们应用G1ParCopyClosure,如代码清单11-3所示:

代码清单11-3 G1ParCopyClosure

void G1ParCopyClosure<barrier, do_mark_object>::do_oop_work(T* p) {
...
oop obj = CompressedOops::decode_not_null(heap_oop);const InCSetState state = _g1h->in_cset_state(obj);
// 若是对象属于CSet
if (state.is_in_cset()) {
oop forwardee;
markOop m = obj->mark_raw();
if (m->is_marked()) { // 若是已经复制过则直接返回复制后的新地址
forwardee = (oop) m->decode_pointer();
} else { // 将它复制到Survivor Region,返回新地址
forwardee = _par_scan_state->copy_to_survivor_space(...);
}
// 修改根集中指向该对象的引用,指向Survivor中复制后的对象
RawAccess<IS_NOT_NULL>::oop_store(p, forwardee);
...
} else {
...
}
}

清理根集的核心代码是copy_to_survivor_space,它将Eden Region中年龄小于15的对象移动到Survivor Region,年龄大于等于15的对象移动到Old Region。以前根集中的引用指向Eden Region对象,对这些引用应用G1ParCopyClosure以后,Eden Region的对象会被复制到SurvivorRegion,因此根集的引用也须要相应改变指向,如图11-3所示。

img

图11-3 清理根集

copy_to_survivor_space在移动对象后还会用G1ScanEvacuatedObjClosure处理对象的成员,若是成员也属于CSet,则将它们放入一个G1ParScanThreadState队列,等待第三阶段将它们复制到Survivor Region。总结来讲,第一阶段会将根集直接可达的对象复制到Survivor Region,并将这些对象的成员放入队列,而后更新根集指向。

处理RSet

第一阶段标记了从GC Root到Eden Region的对象,对于从OldRegion到Eden Region的对象,则须要借助RSet,这一步由G1ParTask的 G1RemSet::oops_into_collection_set_do完成,它包括更新RSet(update_rem_set)和扫描RSet(scan_rem_set)两个过程。

scan_rem_set遍历CSet中的全部Region,找到引用者并将其做为起点开始标记存活对象。

对象复制

通过前面的步骤后,YGC发现的全部存活对象都会位于G1ParScanThreadState队列。对象复制负责将队列中的全部存活对象复制到Survivor Region或者晋升到Old Region,如代码清单11-4所示:

代码清单11-4 对象复制

template <class T> void G1ParScanThreadState::do_oop_evac(T* p) {
// 只复制位于CSet的存活对象
oop obj = RawAccess<IS_NOT_NULL>::oop_load(p);
const InCSetState in_cset_state = _g1h->in_cset_state(obj);
if (!in_cset_state.is_in_cset()) {
return;
}
// 将对象复制到Survivor Region(或晋升到Old Region)
markOop m = obj->mark_raw();
if (m->is_marked()) {
obj = (oop) m->decode_pointer();
} else {
obj = copy_to_survivor_space(in_cset_state, obj, m);
}
RawAccess<IS_NOT_NULL>::oop_store(p, obj);
// 若是复制后的Region和复制前的Region相同,直接返回
if (HeapRegion::is_in_same_region(p, obj)) {
return;}
// 若是复制前Region是老年代,如今复制到Survivor/Old Region,
// 则会产生跨代引用,须要更新RSet
HeapRegion* from = _g1h->heap_region_containing(p);
if (!from->is_young()) {
enqueue_card_if_tracked(p, obj);
}
}

对象复制是YGC的最后一步,在这以后新生代全部存活对象都被移动到Survivor Region或者晋升到Old Region,以前的Eden空间能够被回收(Reclaim)。另外,YGC复制算法至关于作了一次堆碎片的清理工做,如整理Eden Region可能存在的碎片。

相关文章
相关标签/搜索