回收周期(Collecting Cycles)

傳統(tǒng)上,像以前的 php 用到的引用計(jì)數(shù)內(nèi)存機(jī)制,無(wú)法處理循環(huán)的引用內(nèi)存泄漏。然而 5.3.0 PHP 使用文章? 引用計(jì)數(shù)系統(tǒng)中的同步周期回收(Concurrent Cycle Collection in Reference Counted Systems)中的同步算法,來(lái)處理這個(gè)內(nèi)存泄漏問(wèn)題。

對(duì)算法的完全說(shuō)明有點(diǎn)超出這部分內(nèi)容的范圍,將只介紹其中基礎(chǔ)部分。首先,我們先要建立一些基本規(guī)則,如果一個(gè)引用計(jì)數(shù)增加,它將繼續(xù)被使用,當(dāng)然就不再在垃圾中。如果引用計(jì)數(shù)減少到零,所在變量容器將被清除(free)。就是說(shuō),僅僅在引用計(jì)數(shù)減少到非零值時(shí),才會(huì)產(chǎn)生垃圾周期(garbage cycle)。其次,在一個(gè)垃圾周期中,通過(guò)檢查引用計(jì)數(shù)是否減1,并且檢查哪些變量容器的引用次數(shù)是零,來(lái)發(fā)現(xiàn)哪部分是垃圾。

垃圾回收算法

為避免不得不檢查所有引用計(jì)數(shù)可能減少的垃圾周期,這個(gè)算法把所有可能根(possible roots 都是zval變量容器),放在根緩沖區(qū)(root buffer)中(用紫色來(lái)標(biāo)記,稱為疑似垃圾),這樣可以同時(shí)確保每個(gè)可能的垃圾根(possible garbage root)在緩沖區(qū)中只出現(xiàn)一次。僅僅在根緩沖區(qū)滿了時(shí),才對(duì)緩沖區(qū)內(nèi)部所有不同的變量容器執(zhí)行垃圾回收操作??瓷蠄D的步驟 A。

在步驟 B 中,模擬刪除每個(gè)紫色變量。模擬刪除時(shí)可能將不是紫色的普通變量引用數(shù)減"1",如果某個(gè)普通變量引用計(jì)數(shù)變成0了,就對(duì)這個(gè)普通變量再做一次模擬刪除。每個(gè)變量只能被模擬刪除一次,模擬刪除后標(biāo)記為灰(原文說(shuō)確保不會(huì)對(duì)同一個(gè)變量容器減兩次"1",不對(duì)的吧)。

在步驟 C 中,模擬恢復(fù)每個(gè)紫色變量。恢復(fù)是有條件的,當(dāng)變量的引用計(jì)數(shù)大于0時(shí)才對(duì)其做模擬恢復(fù)。同樣每個(gè)變量只能恢復(fù)一次,恢復(fù)后標(biāo)記為黑,基本就是步驟 B 的逆運(yùn)算。這樣剩下的一堆沒(méi)能恢復(fù)的就是該刪除的藍(lán)色節(jié)點(diǎn)了,在步驟 D 中遍歷出來(lái)真的刪除掉。

算法中都是模擬刪除、模擬恢復(fù)、真的刪除,都使用簡(jiǎn)單的遍歷即可(最典型的深搜遍歷)。復(fù)雜度為執(zhí)行模擬操作的節(jié)點(diǎn)數(shù)正相關(guān),不只是紫色的那些疑似垃圾變量。

現(xiàn)在,你已經(jīng)對(duì)這個(gè)算法有了基本了解,我們回頭來(lái)看這個(gè)如何與PHP集成。默認(rèn)的,PHP的垃圾回收機(jī)制是打開(kāi)的,然后有個(gè) php.ini 設(shè)置允許你修改它:zend.enable_gc。

當(dāng)垃圾回收機(jī)制打開(kāi)時(shí),每當(dāng)根緩存區(qū)存滿時(shí),就會(huì)執(zhí)行上面描述的循環(huán)查找算法。根緩存區(qū)有固定的大小,可存10,000個(gè)可能根,當(dāng)然你可以通過(guò)修改PHP源碼文件Zend/zend_gc.c中的常量GC_ROOT_BUFFER_MAX_ENTRIES,然后重新編譯PHP,來(lái)修改這個(gè)10,000值。當(dāng)垃圾回收機(jī)制關(guān)閉時(shí),循環(huán)查找算法永不執(zhí)行,然而,可能根將一直存在根緩沖區(qū)中,不管在配置中垃圾回收機(jī)制是否激活。

當(dāng)垃圾回收機(jī)制關(guān)閉時(shí),如果根緩沖區(qū)存滿了可能根,更多的可能根顯然不會(huì)被記錄。那些沒(méi)被記錄的可能根,將不會(huì)被這個(gè)算法來(lái)分析處理。如果他們是循環(huán)引用周期的一部分,將永不能被清除進(jìn)而導(dǎo)致內(nèi)存泄漏。

即使在垃圾回收機(jī)制不可用時(shí),可能根也被記錄的原因是,相對(duì)于每次找到可能根后檢查垃圾回收機(jī)制是否打開(kāi)而言,記錄可能根的操作更快。不過(guò)垃圾回收和分析機(jī)制本身要耗不少時(shí)間。

除了修改配置zend.enable_gc,也能通過(guò)分別調(diào)用gc_enable()gc_disable()函數(shù)來(lái)打開(kāi)和關(guān)閉垃圾回收機(jī)制。調(diào)用這些函數(shù),與修改配置項(xiàng)來(lái)打開(kāi)或關(guān)閉垃圾回收機(jī)制的效果是一樣的。即使在可能根緩沖區(qū)還沒(méi)滿時(shí),也能強(qiáng)制執(zhí)行周期回收。你能調(diào)用gc_collect_cycles()函數(shù)達(dá)到這個(gè)目的。這個(gè)函數(shù)將返回使用這個(gè)算法回收的周期數(shù)。

允許打開(kāi)和關(guān)閉垃圾回收機(jī)制并且允許自主的初始化的原因,是由于你的應(yīng)用程序的某部分可能是高時(shí)效性的。在這種情況下,你可能不想使用垃圾回收機(jī)制。當(dāng)然,對(duì)你的應(yīng)用程序的某部分關(guān)閉垃圾回收機(jī)制,是在冒著可能內(nèi)存泄漏的風(fēng)險(xiǎn),因?yàn)橐恍┛赡芨苍S存不進(jìn)有限的根緩沖區(qū)。因此,就在你調(diào)用gc_disable()函數(shù)釋放內(nèi)存之前,先調(diào)用gc_collect_cycles()函數(shù)可能比較明智。因?yàn)檫@將清除已存放在根緩沖區(qū)中的所有可能根,然后在垃圾回收機(jī)制被關(guān)閉時(shí),可留下空緩沖區(qū)以有更多空間存儲(chǔ)可能根。