什么是Kdump?
Kdump 是一種的新的crash dump捕獲機制,用來捕獲kernel crash時候產生的crash dump。Kdump需要配置兩個不同目的的kernel,其中一個我們在這里稱作standard(production) kernel;另外一個稱之為Crash(capture)kernel。
standard(production)kernel,是指我正在使用的kernel,當standard kernel在使用的過程中出現crash的時候, kdump會切換到crash kernel, 簡單來說,standard kernel會正運行時發生crash,而crash(capture) Kernel 會被用來捕獲production kernel crash時候產生的crash dump。
捕獲crash dump是在新的crash(capture) kernel 的上下文中來捕獲的,而不是在standard kernel上下文進行。
具體是當standard kernel方式crash的時候,kdump通過kexec(后面介紹)自動啟動進入到crash kernel當中。如果啟動了kdump服務,standard kernel會預留一部分內存, 這部分內存用來啟動crash kernel。
kdump機制主要包括兩個組件:kdump和kexec
kexec是一個快速啟動機制,允許通過已經運行的內核的上下文啟動一個Linux內核,不需要經過BIOS。BIOS可能會消耗很多時間,特別是帶有眾多數量的外設的大型服務器。這種辦法可以為經常啟動機器的開發者節省很多時間。Kexec是實現kdump機制的關鍵,它包括2個組成部分:一是內核空間的系統調用kexec_load,負責在生產內核(production kernel 或 first kernel)啟動時將捕獲內核(capture kernel或sencond kernel)加載到指定地址。二是用戶空間的工具kexec-tools,他將捕獲內核的地址傳遞給生產內核,從而在系統崩潰的時候能夠找到捕獲內核的地址并運行。沒有kexec就沒有kdump。先有kexec實現了在一個內核中可以啟動另一個內核,才讓kdump有了用武之地。
kdump是一種先進的基于kexec的內核崩潰轉儲機制。當系統崩潰時,kdump使用kexec 啟動到第二個內核。第二個內核通常叫做捕獲內核,以很小內存啟動以捕獲轉儲鏡像。第一個內核保留了內存的一部分給第二內核啟動用。由于kdump利用kexec啟動捕獲內核,繞過了 BIOS,所以第一個內核的內存得以保留。這是內核崩潰轉儲的本質。kdump需要兩個不同目的的內核,生產內核和捕獲內核。生產內核是捕獲內核服務的對像。捕獲內核會在生產內核崩潰時啟動起來,與相應的ramdisk一起組建一個微環境,用以對生產內核下的內存進行收集和轉存。注意,在啟動時,kdump保留了一定數量的重要的內存,為了計算系統需要的真正最小內存,加上kdump使用的內存數量,以決定真正的最小內存的需求。
kexec和kdump的設計區別:
Kexec的設計是用新內核去覆蓋原內核位置;而KDUMP是預留一塊內存來加載第二個內核(和相關數據),Crash后第二個內核在原位置運行(不然就達不到相關目的了),收集第一個內核的相關內存信息。
下面開始試驗kdump特性:
操作系統:ubuntu 12.10(3.5.0-17-generic)
安裝kdump工具
生成dump文件后/var/crash的目錄結構:
├── 201305061817
│ ├── config_link -> /boot/config-3.5.0-17-generic
│ ├── dump.201305061817
│ ├── kernel_link -> /usr/lib/debug/boot/vmlinux-3.5.0-17-generic
│ └── system.map_link -> /boot/System.map-3.5.0-17-generic
├── config_link -> /boot/config-3.5.0-17-generic
├── kernel_link -> /usr/lib/debug/boot/vmlinux-3.5.0-17-generic
├── kexec_cmd
└── system.map_link -> /boot/System.map-3.5.0-17-generic
ump.201305061817就是生成的dump文件,后面的一串數字誒當時的時間戳。
接下來用crash進行分析
新聞熱點
疑難解答