前言
在使用Memory Analyzer tool(MAT)分析內存泄漏(一)中,我介紹了內存泄漏的前因后果。在本文中,將介紹MAT如何根據heap dump分析泄漏根源。由于測試范例可能過于簡單,很容易找出問題,但我期待借此舉一反三。
一開始不得不說說ClassLoader,本質上,它的工作就是把磁盤上的類文件讀入內存,然后調用java.lang.ClassLoader.defineClass方法告訴系統把內存鏡像處理成合法的字節碼。Java提供了抽象類ClassLoader,所有用戶自定義類裝載器都實例化自ClassLoader的子類。system class loader在沒有指定裝載器的情況下默認裝載用戶類,在Sun Java 1.5中既sun.misc.Launcher$AppClassLoader。更詳細的內容請參看下面的資料。
【科學上網軟件點擊下載(能上youtube、facebook,享受google服務)】
準備heap dump
請看下面的Pilot類,沒啥特殊的。
然后再看OOMHeapTest類,它是如何撐破heap dump的。
是的,上面構造了很多的Pilot類實例,向數組和map中放。由于是Strong Ref,GC自然不會回收這些對象,一直放在heap中直到溢出。當然在運行前,先要在Eclipse中配置VM參數-XX:+HeapDumpOnOutOfMemoryError。好了,一會兒功夫內存溢出,控制臺打出如下信息。
java_pid3600.hprof既是heap dump,可以在OOMHeapTest類所在的工程根目錄下找到。
MAT安裝
話分兩頭說,有了heap dump還得安裝MAT。可以在http://www.eclipse.org/mat/downloads.php選擇合適的方式安裝。安裝完成后切換到Memory Analyzer視圖。在Eclipse的左上角有Open Heap Dump按鈕,按照剛才說的路徑找到java_pid3600.hprof文件并打開。解析hprof文件會花些時間,然后會彈出向導,直接Finish即可。稍后會看到下圖所示的界面。
MAT工具分析了heap dump后在界面上非常直觀的展示了一個餅圖,該圖深色區域被懷疑有內存泄漏,可以發現整個heap才64M內存,深色區域就占了99.5%。接下來是一個簡短的描述,告訴我們main線程占用了大量內存,并且明確指出system class loader加載的"java.lang.Thread"實例有內存聚集,并建議用關鍵字"java.lang.Thread"進行檢查。所以,MAT通過簡單的兩句話就說明了問題所在,就算使用者沒什么處理內存問題的經驗。在下面還有一個"Details"鏈接,在點開之前不妨考慮一個問題:為何對象實例會聚集在內存中,為何存活(而未被GC)?是的——Strong Ref,那么再走近一些吧。
點擊了"Details"鏈接之后,除了在上一頁看到的描述外,還有Shortest Paths To the Accumulation Point和Accumulated Objects部分,這里說明了從GC root到聚集點的最短路徑,以及完整的reference chain。觀察Accumulated Objects部分,java.util.HashMap和java.lang.Object[1000000]實例的retained heap(size)最大,在上一篇文章中我們知道retained heap代表從該類實例沿著reference chain往下所能收集到的其他類實例的shallow heap(size)總和,所以明顯類實例都聚集在HashMap和Object數組中了。這里我們發現一個有趣的現象,既Object數組的shallow heap和retained heap竟然一樣,通過Shallow and retained sizes一文可知,數組的shallow heap和一般對象(非數組)不同,依賴于數組的長度和里面的元素的類型,對數組求shallow heap,也就是求數組集合內所有對象的shallow heap之和。好,再來看org.rosenjiang.bo.Pilot對象實例的shallow heap為何是16,因為對象頭是8字節,成員變量int是4字節、String引用是4字節,故總共16字節。
接著往下看,來到了Accumulated Objects by Class區域,顧名思義,這里能找到被聚集的對象實例的類名。org.rosenjiang.bo.Pilot類上頭條了,被實例化了290,325次,再返回去看程序,我承認是故意這么干的。還有很多有用的報告可用來協助分析問題,只是本文中的例子太簡單,也用不上。以后如有用到,一定撰文詳細敘述。
又是perm gen
我們在上一篇文章中知道,perm gen是個異類,里面存儲了類和方法數據(與class loader有關)以及interned strings(字符串駐留)。在heap dump中沒有包含太多的perm gen信息。那么我們就用這些少量的信息來解決問題吧。
看下面的代碼,利用interned strings把perm gen撐破了。
控制臺打印如下的信息,然后把java_pid1824.hprof文件導入到MAT。其實在MAT里,看到的狀況應該和“OutOfMemoryError: Java heap space”差不多(用了數組),因為heap dump并沒有包含interned strings方面的任何信息。只是在這里需要強調,使用intern()方法的時候應該多加注意。
倒是在思考如何把class loader撐破廢了些心思。經過嘗試,發現使用ASM來動態生成類才能達到目的。ASM(http://asm.objectweb.org)的主要作用是處理已編譯類(compiled class),能對已編譯類進行生成、轉換、分析(功能之一是實現動態代理),而且它運行起來足夠的快和小巧,文檔也全面,實屬居家必備之良品。ASM提供了core API和tree API,前者是基于事件的方式,后者是基于對象的方式,類似于xml的SAX、DOM解析,但是使用tree API性能會有損失。既然下面要用到ASM,這里不得不啰嗦下已編譯類的結構,包括:
1、修飾符(例如public、private)、類名、父類名、接口和annotation部分。
2、類成員變量聲明,包括每個成員的修飾符、名字、類型和annotation。
3、方法和構造函數描述,包括修飾符、名字、返回和傳入參數類型,以及annotation。當然還包括這些方法或構造函數的具體Java字節碼。
4、常量池(constant pool)部分,constant pool是一個包含類中出現的數字、字符串、類型常量的數組。
已編譯類和原來的類源碼區別在于,已編譯類只包含類本身,內部類不會在已編譯類中出現,而是生成另外一個已編譯類文件;其二,已編譯類中沒有注釋;其三,已編譯類沒有package和import部分。
這里還得說說已編譯類對Java類型的描述,對于原始類型由單個大寫字母表示,Z代表boolean、C代表char、B代表byte、S代表short、I代表int、F代表float、J代表long、D代表double;而對類類型的描述使用內部名(internal name)外加前綴L和后面的分號共同表示來表示,所謂內部名就是帶全包路徑的表示法,例如String的內部名是java/lang/String;對于數組類型,使用單方括號加上數據元素類型的方式描述。最后對于方法的描述,用圓括號來表示,如果返回是void用V表示,具體參考下圖。
下面的代碼中會使用ASM core API,注意接口ClassVisitor是核心,FieldVisitor、MethodVisitor都是輔助接口。ClassVisitor應該按照這樣的方式來調用:visit visitSource? visitOuterClass? ( visitAnnotation | visitAttribute )*( visitInnerClass | visitField | visitMethod )* visitEnd。就是說visit方法必須首先調用,再調用最多一次的visitSource,再調用最多一次的visitOuterClass方法,接下來再多次調用visitAnnotation和visitAttribute方法,最后是多次調用visitInnerClass、visitField和visitMethod方法。調用完后再調用visitEnd方法作為結尾。
注意ClassWriter類,該類實現了ClassVisitor接口,通過toByteArray方法可以把已編譯類直接構建成二進制形式。由于我們要動態生成子類,所以這里只對ClassWriter感興趣。首先是抽象類原型:
其次是自定義類加載器,實在沒法,ClassLoader的defineClass方法都是protected的,要加載字節數組形式(因為toByteArray了)的類只有繼承一下自己再實現。
最后是測試類。
不一會兒,控制臺就報錯了。
打開java_pid3023.hprof文件,注意看下圖的Classes: 88.1k和Class Loader: 87.7k部分,從這點可看出class loader加載了大量的類。
更進一步分析,點擊上圖中紅框線圈起來的按鈕,選擇Java Basics——Class Loader Explorer功能。打開后能看到下圖所示的界面,第一列是class loader名字;第二列是class loader已定義類(defined classes)的個數,這里要說一下已定義類和已加載類(loaded classes)了,當需要加載類的時候,相應的class loader會首先把請求委派給父class loader,只有當父class loader加載失敗后,該class loader才會自己定義并加載類,這就是Java自己的“雙親委派加載鏈”結構;第三列是class loader所加載的類的實例數目。
在Class Loader Explorer這里,能發現class loader是否加載了過多的類。另外,還有Duplicate Classes功能,也能協助分析重復加載的類,在此就不再截圖了,可以肯定的是MyAbsClass被重復加載了N多次。
最后
其實MAT工具非常的強大,上面故弄玄虛的范例代碼根本用不上MAT的其他分析功能,所以就不再描述了。其實對于OOM不只我列舉的兩種溢出錯誤,還有多種其他錯誤,但我想說的是,對于perm gen,如果實在找不出問題所在,建議使用JVM的-verbose參數,該參數會在后臺打印出日志,可以用來查看哪個class loader加載了什么類,例:“[Loaded org.rosenjiang.test.MyAbsClass from org.rosenjiang.test.MyClassLoader]”。
全文完。
轉載自:http://blog.csdn.net/sunny2come/article/details/16820695
原作者:Rosen Jiang 出處: http://www.blogjava.net/rosen
新聞熱點
疑難解答