CLR垃圾回收器根據(jù)所占空間大小劃分對(duì)象。大對(duì)象和小對(duì)象的處理方式有很大區(qū)別。比如內(nèi)存碎片整理 —— 在內(nèi)存中移動(dòng)大對(duì)象的成本是昂貴的,讓我們研究一下垃圾回收器是如何處理大對(duì)象的,大對(duì)象對(duì)程序性能有哪些潛在的影響。
大對(duì)象堆和垃圾回收
在.Net 1.0和2.0中,如果一個(gè)對(duì)象的大小超過(guò)85000byte,就認(rèn)為這是一個(gè)大對(duì)象。這個(gè)數(shù)字是根據(jù)性能優(yōu)化的經(jīng)驗(yàn)得到的。當(dāng)一個(gè)對(duì)象申請(qǐng)內(nèi)存大小達(dá)到這個(gè)閥值,它就會(huì)被分配到大對(duì)象堆上。這意味著什么呢?要理解這個(gè),我們需要理解.Net垃圾回收機(jī)制。
如大多人所知道的,.Net GC是按照“代”來(lái)回收的。程序中的對(duì)象共有3代,0代、1代和2代,0代是最年輕的對(duì)象,2代對(duì)象存活的時(shí)間最長(zhǎng)。GC按代回收垃圾也是出于性能考慮 的;通常的對(duì)象都會(huì)在0代是被回收。例如,在一個(gè)asp.net程序中,和每一個(gè)請(qǐng)求相關(guān)的對(duì)象都應(yīng)該在請(qǐng)求結(jié)束時(shí)回收掉。而沒(méi)有被回收的對(duì)象會(huì)成為1代 對(duì)象;也就是說(shuō)1代對(duì)象是常駐內(nèi)存對(duì)象和馬上消亡對(duì)象之間的一個(gè)緩沖區(qū)。
從代的角度看,大對(duì)象屬于2代對(duì)象,因?yàn)橹挥性?代回收時(shí)才會(huì)處理大對(duì)象。當(dāng)某代垃圾回收?qǐng)?zhí)行時(shí),會(huì)同時(shí)執(zhí)行更年輕代的垃圾回收。比如:當(dāng)1代垃圾回收時(shí)會(huì)同時(shí)回收1代和0代的對(duì)象,當(dāng)2代垃圾回收時(shí)會(huì)執(zhí)行1代和0代的回收.
代是垃圾回收器區(qū)分內(nèi)存區(qū)域的邏輯視圖。從物理存儲(chǔ)角度看,對(duì)象分配在不同的托管堆上。一個(gè)托管堆(managed heap)是垃圾回收器從操作系統(tǒng)申請(qǐng)的內(nèi)存區(qū)(通過(guò)調(diào)用windows api VirtualAlloc)。當(dāng)CLR載入內(nèi)存之后,會(huì)初始化兩個(gè)托管堆,一個(gè)大對(duì)象堆(LOH –large object heap)和一個(gè)小對(duì)象對(duì)(SOH – small object heap)。
內(nèi)存分配請(qǐng)求就是將托管對(duì)象放到對(duì)應(yīng)的托管堆上。如果對(duì)象的大小小于85000byte,它會(huì)被放置在SOH;否則會(huì)被放在LOH上。
對(duì)于SOH,對(duì)象在執(zhí)行一次垃圾回收之后,會(huì)進(jìn)入到下一代。也就是說(shuō)如果在第一次執(zhí)行垃圾回收時(shí),存活下來(lái)的對(duì)象會(huì)進(jìn)入第二代,如果在第2次垃圾回收之后該對(duì)象仍然沒(méi)有被當(dāng)作垃圾回收掉,它就會(huì)成為2代對(duì)象;2代對(duì)象就是最老的對(duì)象不會(huì)在提升代數(shù)。
當(dāng)觸發(fā)垃圾回收時(shí),垃圾回收器會(huì)在小對(duì)象堆做碎片整理,將存活下來(lái)的對(duì)象移動(dòng)到一起。而對(duì)于大對(duì)象堆,由于移動(dòng)內(nèi)存的開(kāi)銷很大,CLR團(tuán)隊(duì)選擇只是清除它們,將回收掉的對(duì)象組成一個(gè)列表,以便滿足下次有大對(duì)象申請(qǐng)使用內(nèi)存,相鄰的垃圾對(duì)象會(huì)被合并成一塊空閑的內(nèi)存塊。
需要時(shí)時(shí)留意的是,直到.Net 4.0中也不會(huì)對(duì)大對(duì)象堆做碎片整理操作,將來(lái)也許會(huì)做。因此如果你要分配大對(duì)象并不想他們被移動(dòng),你可以使用fixed語(yǔ)句。
如下小對(duì)象堆SOH的回收示意圖
上圖中第一次垃圾回收之前有四個(gè)對(duì)象obj0-3;在第一垃圾回收之后obj1和obj3被回收了,同時(shí)obj2和obj0移動(dòng)到一起了;在第二次 垃圾回收之前有分配了三個(gè)對(duì)象obj4-6;在第二次執(zhí)行垃圾回收之后obj2和obj5被回收了,obj4和obj6被移動(dòng)到obj0旁邊。
下圖是大對(duì)象堆LOH回收示意圖
可以看到在未執(zhí)行垃圾回收之前,一共有四個(gè)對(duì)象obj0-3;第一次二代垃圾回收之后obj1和obj2被回收掉了,回收掉之后obj1和obj2 所占空間被合并到了一起,在obj4申請(qǐng)分配內(nèi)存時(shí)就把obj1和obj2回收后釋放的空間分配給它了;同時(shí)留下了一塊內(nèi)存碎片。如果這個(gè)碎片的大小小于 85000byte,那么這個(gè)碎片就在這個(gè)程序的生命周期中永遠(yuǎn)不能被再次利用了。
如果大對(duì)象堆上沒(méi)有足夠的空閑內(nèi)存容納要申請(qǐng)的大對(duì)象空間,CLR首先會(huì)嘗試向操作系統(tǒng)申請(qǐng)內(nèi)存,如果申請(qǐng)失敗,就會(huì)觸發(fā)一次二代回收來(lái)嘗試釋放一些內(nèi)存。
在2代垃圾回收時(shí),可以將不需要的內(nèi)存通過(guò)VirtualFree交還給操作系統(tǒng)。交還的過(guò)程參見(jiàn)下圖:
什么時(shí)候回收大對(duì)象呢?
在討論什么時(shí)候回收大對(duì)象之前先來(lái)看下普通的垃圾回收操作什么時(shí)機(jī)執(zhí)行吧。垃圾回收在下列情況下發(fā)生:
1. 申請(qǐng)的空間超過(guò)0代內(nèi)存大小或者大對(duì)象堆的閥值,多數(shù)的托管堆垃圾回收在這種情況下發(fā)生
2. 在程序代碼中調(diào)用GC.Collect方法時(shí);如果在調(diào)用GC.Collect方法是傳入GC.MaxGeneration參數(shù)時(shí),會(huì)執(zhí)行所有代對(duì)象的垃圾回收,包括大對(duì)象堆的垃圾回收
3. 操作系統(tǒng)內(nèi)存不足時(shí),當(dāng)應(yīng)用程序收到操作系統(tǒng)發(fā)出的高內(nèi)存通知時(shí)
4. 如果垃圾回收算法認(rèn)為做二代回收是有收效時(shí)會(huì)觸發(fā)二代垃圾回收
5. 每一代對(duì)象堆的都有一個(gè)所占空間大小閥值的屬性,當(dāng)你分配對(duì)象到某一代,你增長(zhǎng)了內(nèi)存總量接近了該代的閥值,或者分配對(duì)象導(dǎo)致這一代的堆大小超過(guò)了堆閥 值,就會(huì)發(fā)生一次垃圾回收。因此當(dāng)你分配小對(duì)象或者大對(duì)象時(shí),會(huì)對(duì)應(yīng)消耗0代堆或者大對(duì)象堆的閥值。當(dāng)垃圾回收器將對(duì)象代數(shù)提升到1代或者2代時(shí),會(huì)消耗 1、2代的閥值。在程序運(yùn)行中這些閥值是動(dòng)態(tài)變化的。
大對(duì)象堆性能影響
讓我們先看下分配大對(duì)象的代價(jià)。 CLR為每個(gè)新對(duì)象分配內(nèi)存時(shí)都要保證這些內(nèi)存清空的,是沒(méi)有被其他對(duì)象使用的(I give out is cleared)。這就意味著分配的代價(jià)完全被清理(clearing)的代價(jià)控制著(除非在分配時(shí)觸發(fā)了一次垃圾回收)。如果清空1byte需要2個(gè)周 期(cycles),就意味著清除一個(gè)最小的大對(duì)象需要170,000個(gè)周期。通常情況下人們不會(huì)分配超大的對(duì)象,比如說(shuō)在2GHz的機(jī)器上分配16M大 小的對(duì)象,大約需要16ms來(lái)清空內(nèi)存。這代價(jià)太大了。
讓我們?cè)诳聪禄厥盏拇鷥r(jià)。前面提到過(guò),大對(duì)象和2代齡對(duì)象一起回收。如果大對(duì)象或者2代對(duì)象占用空間超過(guò)其閥值時(shí),就會(huì)觸發(fā)2代對(duì)象的回收。如果2 代回收因?yàn)榇髮?duì)象堆超過(guò)閥值被觸發(fā),2代對(duì)象堆本身沒(méi)有多少對(duì)象可以做回收。如果在2代堆上沒(méi)有多少對(duì)象,這問(wèn)題不大。但是如果2代堆很大對(duì)象很多,過(guò)多 的2代回收就會(huì)導(dǎo)致性能問(wèn)題。如果是臨時(shí)性的分配大對(duì)象,就需要很多的時(shí)間來(lái)運(yùn)行垃圾回收;也就是說(shuō)如果你持續(xù)的使用大對(duì)象然后又釋放大對(duì)象對(duì)性能會(huì)有很 大的負(fù)面影響。
大對(duì)象堆上的巨大對(duì)象通常是數(shù)組(很少有一個(gè)對(duì)象很大的情況)。如果對(duì)象中的元素是強(qiáng)引用,代價(jià)會(huì)很高;如果元素之間沒(méi)有相互引用,垃圾回收時(shí)就不需要遍歷整個(gè)數(shù)組。例如:用一個(gè)數(shù)組來(lái)保存二叉樹(shù)的節(jié)點(diǎn),一種方法是在節(jié)點(diǎn)中強(qiáng)引用左右節(jié)點(diǎn):
class Node
{
Data d;
Node left;
Node right;
}
Node[] binaryTree = new Node[num_nodes];
如果num_nodes是一個(gè)很大的數(shù)字,就意味著每個(gè)節(jié)點(diǎn)都至少需要查看二個(gè)引用元素。一種替代方案是在節(jié)點(diǎn)中保存左右節(jié)點(diǎn)元素的數(shù)組索引號(hào)
class Node
{
Data d;
uint left_index;
uint right_index;
}
這樣的話,元素之間的引用關(guān)系去掉了;可以通過(guò)binaryTree[left_index]來(lái)獲得引用的節(jié)點(diǎn)。垃圾回收器在做垃圾回收時(shí)也不需要看相關(guān)的引用元素了。
為大對(duì)象堆收集性能數(shù)據(jù)
有幾種方法可以收集大對(duì)象堆相關(guān)的性能數(shù)據(jù)。在我解釋這些方法之前,讓我們先談一下為什么需要收集大對(duì)象堆相關(guān)的性能數(shù)據(jù)。
在你開(kāi)始上搜集某個(gè)方面的性能數(shù)據(jù)時(shí),有可能你已經(jīng)找到這方面造成性能瓶頸的證據(jù);或者你已經(jīng)沒(méi)有找遍了所有方面都沒(méi)有發(fā)現(xiàn)問(wèn)題。
在查找性能問(wèn)題時(shí).Net CLR Memory 性能計(jì)數(shù)器通常是應(yīng)該先考慮使用的工具。和LOH相關(guān)的計(jì)數(shù)器有g(shù)eneration 2 collectioins(2代堆收集次數(shù))和large object heap size大對(duì)象堆大小。Generation 2 collections顯示的是進(jìn)程啟動(dòng)之后2代垃圾回收操作發(fā)生的次數(shù)。Large object heap size計(jì)數(shù)器顯示的是當(dāng)前大對(duì)象堆的大小值,包括空閑空間;這個(gè)計(jì)數(shù)器是在每次垃圾回收操作之后做更新,并非每次分配內(nèi)存都做更新。
可以參考下圖在windows性能計(jì)數(shù)器中觀察.Net CLR Memory相關(guān)性能數(shù)據(jù)
你也可以通過(guò)程序查詢這些計(jì)數(shù)器的值;很多人通過(guò)程序的方式收集性能計(jì)數(shù)器來(lái)幫助查找性能瓶頸。
當(dāng)然也可以使用調(diào)試器winddbg觀察大對(duì)象堆。
最后提示一下:到目前為止,大對(duì)象堆作為垃圾回收的一部分是不做內(nèi)存碎片整理的,但是這個(gè)只是一個(gè)clr的實(shí)現(xiàn)細(xì)節(jié),程序代碼不應(yīng)該依賴這個(gè)特點(diǎn)。如果要確保對(duì)象不會(huì)被垃圾回收器移動(dòng),就要使用fixed語(yǔ)句。
文章來(lái)源:伯樂(lè)在線
新聞熱點(diǎn)
疑難解答
圖片精選