PostgreSQL7.0手冊-程序員手冊 -44. 索引開銷計算函數
2019-09-08 23:33:43
供稿:網友
第四十四章. 索引開銷計算函數
作者:由 Tom Lane 寫于 2000-01-24.
注意:這些內容最后必須成為關于書寫新的索引訪問方式的更大的一章的一部分.
每種索引訪問模式都必須提供一個用于規劃器/優化器的開銷計算函數.這個函數的過程 OID 在訪問模式在 pg_am 里的記錄的 amcostestimate 字段里給出.
注意:在 Postgres 7.0 以前,使用的是另外一種注冊與索引相關的開銷計算函數的構造.
amcostestimate 函數收到一列 WHERE 子句,這些子句被認為是對索引有用的.這個函數本身必須返回計算出來的訪問索引的開銷和 WHERE 子句的選擇性(也就是說,在索引掃描過程中主表中要被撿索出來的部分).對于簡單的情況,幾乎所有開銷計算器的工作都可以通過調用優化器里標準的過程來完成,需要一個 amcostestimate 函數的原因是允許索引訪問模式提供一些索引類型相關的信息,這樣就有可能改進標準的計算(預計).
每個 amcostestimate 函數都必須有下面的名字:
void
amcostestimate (Query *root,
RelOptInfo *rel,
IndexOptInfo *index,
List *indexQuals,
Cost *indexStartupCost,
Cost *indexTotalCost,
Selectivity *indexSelectivity);
前面四個參數是輸入:
root
被處理的查詢.
rel
索引所處的關系.
index
索引本身.
indexQuals
索引條件子句列表(隱含地 AND);一個 NIL 列表表明沒有可用的條件.
最后三個參數是傳遞的引用輸出:
*indexStartupCost
設置為索引啟動處理的開銷
*indexTotalCost
設置為索引處理的總開銷
*indexSelectivity
設置為索引選擇性
請注意開銷計算函數必須用 C 寫,因為他們必須訪問規劃器/優化器的內部數據結構.
索引訪問開銷應該以 src/backend/optimizer/path/costsize.c 里面使用的單位計算:一次順序磁盤存儲塊抓取開銷為 1.0,一次非順序抓取的開銷為 random_page_cost,并且處理一個索引記錄的開銷通常應該當做 cpu_index_tuple_cost (它是一個可以由用戶調節的優化器參數).另外,應該用一個cpu_operator_cost 的合適的倍數作為索引處理期間任何激活的比較操作符(尤其是計算 indexQuals (索引查詢)自己).
訪問開銷應該包含所有與掃描索引本身的相關的磁盤和 CPU 開銷,而不是檢索或處理被索引標識的主表索引的開銷.
"啟動開銷"是全部索引開銷中在我們開始抓取第一條記錄之前必須消耗的開銷.對于大多數索引,這部分可以當做零,但是一個有著比較高啟動開銷的索引類型可能希望把這個值設置為非零.
indexSelectivity (索引選擇性)應該設置為在索引掃描過程中主表記錄里將被檢索出的部分.如果是一個松索引的場合,這個數字將明顯地比實際傳遞給給出的資格條件的記錄部分高.
開銷計算
一次典型的開銷計算器將象下面這樣進行:
計算和返回基于給出的資格條件的將要訪問的主表的記錄的數量.如果不知到任何索引類型相關的信息,則使用標準的優化器函數 clauselist_selectivity():
*indexSelectivity = clauselist_selectivity(root, indexQuals,
lfirsti(rel->relids));
計算(估計)在掃描過程中將要被訪問的索引記錄數.對于許多索引類型,這個數字等于 indexSelectivity 乘以索引里面的記錄數量,但是它可以更多.(請注意索引在頁面里的大小和記錄可以從結構 IndexOptInfo 里獲得.)
計算(估計)在掃描過程中將要被檢索出的索引頁面數.這個數字可以只是 indexSelectivity 乘以以頁面數計算的索引的大小.
計算索引訪問開銷.一個常間的計算器可以這樣做:
/*
* Our generic assumption is that the index pages will be read
* sequentially, so they have cost 1.0 each, not random_page_cost.
* Also, we charge for evaluation of the indexquals at each index tuple.
* All the costs are assumed to be paid incrementally during the scan
* (我們一般性的假設是索引頁面將被順序讀入,
* 因此它們每個的開銷為1.0,沒有 random_page_cose.
* 同樣,我們計算每條索引記錄的索引條件的開銷.
* 所有開銷都假設是在掃描過程中逐步遞增的.
*/
*indexStartupCost = 0;
*indexTotalCost = numIndexPages +
(cpu_index_tuple_cost + cost_qual_eval(indexQuals)) * numIndexTuples;
開銷計算器的例子可以在 src/backend/utils/adt/selfuncs.c 找到.
通常,一個 amcostestimate 函數的 pg_proc 記錄會看起來象
prorettype = 0
pronargs = 7
proargtypes = 0 0 0 0 0 0 0
我們將零("opaque")用于所有參數,因為它們沒有一個有在 pg_type 里面已知的類型.