db2優(yōu)化(簡(jiǎn)易版)
預(yù)備—monitors on
db2 "update monitor switches using
lock on sort on bufferpool on uow on
table on statement on"
打開監(jiān)視開關(guān),獲取需要的性能信息
最簡(jiǎn)單而最見成效的—bufferpool
緩沖池是內(nèi)存中的一塊存儲(chǔ)區(qū)域,用于臨時(shí)讀入和更改數(shù)據(jù)庫頁(包含表行或索引項(xiàng))。緩沖池的用途是為了提高數(shù)據(jù)庫系統(tǒng)的性能。從內(nèi)存訪問數(shù)據(jù)要比從磁盤訪問數(shù)據(jù)快得多。因此,數(shù)據(jù)庫管理器需要從磁盤讀取或?qū)懭氪疟P的次數(shù)越少,性能就越好。對(duì)一個(gè)或多個(gè)緩沖池進(jìn)行配置之所以是調(diào)優(yōu)的最重要方面,是因?yàn)檫B接至數(shù)據(jù)庫的應(yīng)用程序的大多數(shù)數(shù)據(jù)(不包括大對(duì)象和長(zhǎng)字段數(shù)據(jù))操作都在緩沖池中進(jìn)行。
缺省情況下,應(yīng)用程序使用緩沖池 ibmdefaultbp,它是在創(chuàng)建數(shù)據(jù)庫時(shí)創(chuàng)建的。當(dāng) syscat.bufferpools 目錄表中該緩沖池的 npages 值為 -1 時(shí),db2 數(shù)據(jù)庫配置參數(shù) buffpage 控制著緩沖池的大小。否則會(huì)忽略 buffpage 參數(shù),并且用 npages 參數(shù)所指定的頁數(shù)創(chuàng)建緩沖池。
建議對(duì)于僅使用一個(gè)緩沖池的應(yīng)用程序,將 npages 更改成 -1,這樣 buffpage 就可以控制該緩沖池的大小。這使得更新和報(bào)告緩沖池大小以及其它 db2 數(shù)據(jù)庫配置參數(shù)變得更加方便。
確保可以使用數(shù)據(jù)庫配置中的 buffpage 參數(shù)來控制緩沖池大小之后,將該參數(shù)設(shè)置成合適的值。根據(jù)數(shù)據(jù)庫的大小和應(yīng)用程序的性質(zhì)將該參數(shù)設(shè)置成一個(gè)合理的大值,這種做法很安全。通常,該參數(shù)的缺省值非常小,可能滿足不了要求。
db2 "get snapshot for all bufferpools"
在數(shù)據(jù)庫快照或緩沖池快照的快照輸出中,查找下列"logical reads"和"physical reads",這樣就可以計(jì)算出緩沖池命中率,它可以幫助調(diào)優(yōu)緩沖池:
緩沖池命中率表明數(shù)據(jù)庫管理器不需要從磁盤裝入頁(即該頁已經(jīng)在緩沖池中)就能處理頁請(qǐng)求的時(shí)間百分比。緩沖池的命中率越高,使用磁盤 i/o 的頻率就越低。按如下計(jì)算緩沖池命中率:
(1 - ((buffer pool data physical reads + buffer pool index physical reads) /
(buffer pool data logical reads + pool index logical reads))
) * 100%
這個(gè)計(jì)算考慮了緩沖池高速緩存的所有頁(索引和數(shù)據(jù))。理想情況下,該比率應(yīng)當(dāng)超過 95%,并盡可能接近 100%。要提高緩沖池命中率,請(qǐng)嘗試下面這些方法:
增加緩沖池大小。
考慮分配多個(gè)緩沖池,如果可能的話,為每個(gè)經(jīng)常被訪問的大表所屬的表空間分配一個(gè)緩沖池,為一組小表分配一個(gè)緩沖池,然后嘗試一下使用不同大小的緩沖池以查看哪種組合會(huì)提供最佳性能。
如果已分配的內(nèi)存不能幫助提高性能,那么請(qǐng)避免給緩沖池分配過多的內(nèi)存。應(yīng)當(dāng)根據(jù)取自測(cè)試環(huán)境的快照信息來決定緩沖池的大小。
太小的緩沖池會(huì)產(chǎn)生過多的、不必要的物理 i/o。太大的緩沖池使系統(tǒng)處在操作系統(tǒng)頁面調(diào)度的風(fēng)險(xiǎn)中并消耗不必要的 cpu 周期來管理過度分配的內(nèi)存。正好合適的緩沖池大小就在"太小"和"太大"之間的某個(gè)平衡點(diǎn)上。適當(dāng)?shù)拇笮〈嬖谟诨貓?bào)將要開始減少的點(diǎn)上。
獲得最佳性能的—sql
一條糟糕的 sql 語句會(huì)徹底破壞一切。一個(gè)相對(duì)簡(jiǎn)單的 sql 語句也能夠搞糟一個(gè)調(diào)整得很好的數(shù)據(jù)庫和機(jī)器。對(duì)于很多這些語句,天底下(或在文件中)沒有 db2 udb 配置參數(shù)能夠糾正因錯(cuò)誤的 sql 語句導(dǎo)致的高成本的情況。
更糟糕的是,dba 常常受到種種束縛:不能更改 sql(可能是因?yàn)樗菓?yīng)用程序供應(yīng)商提供的)。這給 dba 只留下三條路可走:
1. 更改或添加索引
2. 更改群集
3. 更改目錄統(tǒng)計(jì)信息
健壯的應(yīng)用程序由成千上萬條不同的 sql 語句組成。這些語句執(zhí)行的頻率隨應(yīng)用程序的功能和日常的業(yè)務(wù)需要的不同而不同。sql 語句的實(shí)際成本是它執(zhí)行一次的成本乘以它執(zhí)行的次數(shù)。
每個(gè) dba 所面臨的重大的任務(wù)是,識(shí)別具有最高"實(shí)際成本"的語句的挑戰(zhàn),并且減少這些語句的成本。
通過本機(jī) db2 explain 實(shí)用程序、一些第三方供應(yīng)商提供的工具或 db2 udb sql event monitor 數(shù)據(jù),可以計(jì)算出執(zhí)行一次 sql 語句所用的資源成本。但是語句執(zhí)行頻率只能通過仔細(xì)和耗時(shí)地分析 db2 udb sql event monitor 的數(shù)據(jù)來了解。
最佳性能不僅需要排除高成本 sql 語句,而且需要確保相應(yīng)的物理基礎(chǔ)結(jié)構(gòu)是適當(dāng)?shù)?。?dāng)所有的調(diào)節(jié)旋鈕都設(shè)置得恰到好處、內(nèi)存被有效地分配到池和堆而且 i/o 均勻地分配到各個(gè)磁盤時(shí),才可得到最佳性能。
不可遺漏的—lock
這些與鎖相關(guān)的控制都是數(shù)據(jù)庫配置參數(shù):
locklist 表明分配給鎖列表的存儲(chǔ)容量。每個(gè)數(shù)據(jù)庫都有一個(gè)鎖列表,鎖列表包含了并發(fā)連接到該數(shù)據(jù)庫的所有應(yīng)用程序所持有的鎖。鎖定是數(shù)據(jù)庫管理器用來控制多個(gè)應(yīng)用程序并發(fā)訪問數(shù)據(jù)庫中數(shù)據(jù)的機(jī)制。行和表都可以被鎖定。根據(jù)對(duì)象是否還持有其它鎖,每把鎖需要 32 個(gè)或 64 個(gè)字節(jié)的鎖列表:
需要 64 個(gè)字節(jié)來持有某個(gè)對(duì)象上的鎖,在這個(gè)對(duì)象上,沒有持有其它鎖。
需要 32 個(gè)字節(jié)來記錄某個(gè)對(duì)象上的鎖,在這個(gè)對(duì)象上,已經(jīng)持有一個(gè)鎖。
maxlocks 定義了應(yīng)用程序持有的鎖列表的百分比,在數(shù)據(jù)庫管理器執(zhí)行鎖升級(jí)之前必須填充該鎖列表。當(dāng)一個(gè)應(yīng)用程序所使用的鎖列表百分比達(dá)到 maxlocks 時(shí),數(shù)據(jù)庫管理器會(huì)升級(jí)這些鎖,這意味著用表鎖代替行鎖,從而減少列表中鎖的數(shù)量。當(dāng)任何一個(gè)應(yīng)用程序所持有的鎖數(shù)量達(dá)到整個(gè)鎖列表大小的這個(gè)百分比時(shí),對(duì)該應(yīng)用程序所持有的鎖進(jìn)行鎖升級(jí)。如果鎖列表用完了空間,那么也會(huì)發(fā)生鎖升級(jí)。數(shù)據(jù)庫管理器通過查看應(yīng)用程序的鎖列表并查找行鎖最多的表,來決定對(duì)哪些鎖進(jìn)行升級(jí)。如果用一個(gè)表鎖替換這些行鎖,將不再會(huì)超出 maxlocks 值,那么鎖升級(jí)就會(huì)停止。否則,鎖升級(jí)就會(huì)一直進(jìn)行,直到所持有的鎖列表百分比低于 maxlocks。maxlocks 參數(shù)乘以 maxappls 參數(shù)不能小于 100。
雖然升級(jí)過程本身并不用花很多時(shí)間,但是鎖定整個(gè)表(相對(duì)于鎖定個(gè)別行)降低了并發(fā)性,而且數(shù)據(jù)庫的整體性能可能會(huì)由于對(duì)受鎖升級(jí)影響的表的后續(xù)訪問而降低。
locktimeout 的缺省值是 -1,這意味著將沒有鎖超時(shí)(對(duì) oltp 應(yīng)用程序,這種情況可能會(huì)是災(zāi)難性的)。許多 db2 用戶用 locktimeout = -1。將 locktimeout 設(shè)置為很短的時(shí)間值,例如 10 或 15 秒。在鎖上等待過長(zhǎng)時(shí)間會(huì)在鎖上產(chǎn)生雪崩效應(yīng)。
首先,用以下命令檢查 locktimeout 的值:
db2 "get db cfg for dbname"
并查找包含以下文本的行:
lock timeout (sec) (locktimeout) = -1
如果值是 -1,考慮使用以下命令將它更改為 15 秒(一定要首先詢問應(yīng)用程序開發(fā)者或供應(yīng)商以確保應(yīng)用程序能夠處理鎖超時(shí)):
db2 "update db cfg for dbname using locktimeout 15"
同時(shí)應(yīng)該監(jiān)視鎖等待的數(shù)量、鎖等待時(shí)間和正在使用鎖列表內(nèi)存(lock list memory)的量。請(qǐng)發(fā)出以下命令:
db2 "get snapshot for database on dbname"
如果 lock list memory in use (bytes) 超過所定義 locklist 大小的 50%,那么在 locklist 數(shù)據(jù)庫配置中增加 4k 頁的數(shù)量。
掩蓋問題的—sortheap
sortheap 是一個(gè)數(shù)據(jù)庫配置參數(shù),它定義了私有排序所使用的私有內(nèi)存頁的最大數(shù)目,或共享排序所使用的共享內(nèi)存頁的最大數(shù)目。如果排序是私有排序,那么該參數(shù)影響代理程序私有內(nèi)存。如果排序是共享排序,那么該參數(shù)影響數(shù)據(jù)庫的共享內(nèi)存。每個(gè)排序都有單獨(dú)的由數(shù)據(jù)庫管理器按需分配的排序堆。在排序堆中對(duì)數(shù)據(jù)進(jìn)行排序。如果由優(yōu)化器來指導(dǎo)排序堆大小的分配,那么用優(yōu)化器提供的信息來分配的排序堆的大小要小于由該參數(shù)所指定的排序堆大小。
sheapthres 是一個(gè)數(shù)據(jù)庫管理器配置參數(shù)。私有和共享排序所使用內(nèi)存的來源不一樣。共享排序內(nèi)存區(qū)的大小是在第一次連接到數(shù)據(jù)庫時(shí)根據(jù) sheapthres 值以靜態(tài)方式預(yù)先確定的。私有排序內(nèi)存區(qū)的大小是不受限制的。對(duì)于私有排序和共享排序,應(yīng)用 sheapthres 參數(shù)的方式不同:
對(duì)于私有排序,sheapthres 是對(duì)私有排序在任何給定的時(shí)間可以消耗的全部?jī)?nèi)存的實(shí)例級(jí)"軟"限制。當(dāng)實(shí)例的總私有排序內(nèi)存消耗量達(dá)到這一限制時(shí),為其它進(jìn)入的私有排序請(qǐng)求而分配的內(nèi)存會(huì)大大減少。
對(duì)于共享排序,sheapthres 是對(duì)共享排序在任何給定的時(shí)間可以消耗的全部?jī)?nèi)存的數(shù)據(jù)庫級(jí)"硬"限制。當(dāng)達(dá)到這一限制時(shí),不允許有其它共享排序內(nèi)存請(qǐng)求,直到總的共享內(nèi)存消耗量回落到 sheapthres 所指定的限制以下。
使用排序堆的操作示例包括內(nèi)存中表的散列連接和操作。閾值的顯式定義防止數(shù)據(jù)庫管理器將過多數(shù)量的內(nèi)存用于大量排序。
建議
使用數(shù)據(jù)庫系統(tǒng)監(jiān)視器來跟蹤排序活動(dòng)。
使用合適的索引使排序堆的使用降到最低。
當(dāng)需要頻繁進(jìn)行大型排序時(shí),增加 sortheap 的值。
如果增加 sortheap,請(qǐng)確定是否還需要調(diào)整數(shù)據(jù)庫管理器配置文件中的 sheapthres 參數(shù)。
優(yōu)化器用排序堆大小來確定存取路徑。在更改該參數(shù)后請(qǐng)考慮重新綁定應(yīng)用程序(使用 rebind package 命令)。
理想情況下,應(yīng)當(dāng)將排序堆閾值(sheapthres)參數(shù)合理地設(shè)置為在數(shù)據(jù)庫管理器實(shí)例中設(shè)置的 sortheap 參數(shù)最大值的倍數(shù)。該參數(shù)至少應(yīng)當(dāng)是實(shí)例中任何數(shù)據(jù)庫所定義的最大 sortheap 的兩倍。
如何更改這些參數(shù)
要更改 sortheap 和 sheapthres 的值,請(qǐng)運(yùn)行以下命令:
-- sortheap should be changed for individual database --
db2 "update db cfg for db_name using sortheap a_value"
-- sheapthres is a database manager parameter --
db2 "update dbm cfg using sheapthres b_value"
研究步驟
oltp 應(yīng)用程序不應(yīng)該執(zhí)行大型排序。大型排序在 cpu 和 i/o 資源方面的成本太高了。通常,sortheap 大小的缺省值(256 個(gè) 4kb 頁)就足夠了。事實(shí)上,對(duì)于高并發(fā)性 oltp,可能希望降低這個(gè)缺省值。當(dāng)需要進(jìn)一步研究時(shí),可以發(fā)出下面這條命令:
db2 "update monitor switches using sort on"
然后,讓應(yīng)用程序運(yùn)行一會(huì),然后輸入:
db2 "get snapshot for database on dbname"
根據(jù)該輸出,可以計(jì)算每個(gè)事務(wù)的排序數(shù)目,并可以計(jì)算溢出了可用于排序的內(nèi)存的那部分排序的百分比。
sortspertransaction
= (total sorts) / (commit statements attempted + rollback statements attempted)
percentsortoverflow
= (sort overflows * 100 ) / (total sorts)
經(jīng)驗(yàn):如果 sortspertransaction 大于 5,它可能表明每個(gè)事務(wù)的排序太多。如果 percentsortoverflow 大于 3%,那么可能發(fā)生了嚴(yán)重的、未曾預(yù)料到的大型排序。發(fā)生這種情況時(shí),增加 sortheap 只會(huì)隱藏性能問題 - 卻無法修正它。這個(gè)問題的正確解決方案是通過添加正確的索引改進(jìn)有問題的 sql 語句的存取方案。