轉載:點擊打開鏈接 作者:chen825919148
1.8.2,循環語句的注意點
【建議1-27】在多重循環中,如果有可能,應當將最長的循環放在最內層,最短的循環放在最外層,以減少CPU跨切循環層的次數。
例如:
************************************以上是原文************************************
其實,右邊的循環之所以比左邊的效率高,本質原因并非是循環長短的問題,而是與程序訪問的局部性和Cache命中率有關。計算機專業畢業的學生應該很清楚這個問題,在《操作系統》和《體系結構》課程中一般都會探討此問題。我們知道,數組在計算機中是行優先存儲的(即本行的最后一個元素與下一行的第一個元素地址相鄰),左邊的循環中,依次訪問的是變量a[0][0],a[1][0],a[2][0],……,a[99][0],a[0][1],a[1][1],a[2][1],……,a[99][1],……這實際上是按照列優先的原則在訪問數組元素。如果Cache容量相對于數組容量而言不夠大,考慮一個極端情況,假設Cache只有一個塊,只能存儲一行數據,則每訪問一個元素就會發生一次Cache失效,就需要訪問一次主存,讀入一塊數據,導致存儲系統效率低下,明顯影響操作延遲。而右邊的循環采用的是行優先訪問原則,與元素存儲順序一致。基于同樣的假設,此時只有訪問新一行的第一個數據時才發生Cache失效,通過訪問主存讀入一塊連續的數據(恰為數組的一行),此后訪問同行數據便可直接使用Cache中緩存的數據,直到訪問下一行的第一個數據。Cache失效率降低了,整個存儲系統的平均訪問延遲降低了,顯然程序執行效率較高。
內外循環交換是優化程序性能的重要手段之一,右邊程序的存儲訪問局部性較好,建議如此編程。
新聞熱點
疑難解答