Intel開(kāi)創(chuàng)處理器高清新時(shí)代
Intel Intel SSE4 指令包括矢量化編譯器和媒體加速器指令。未來(lái)的英特爾處理器將支持其余指令,而軟件也將能從程序的角度檢測(cè)出處理器支持哪些Intel® SSE4 指令。那么我們?cè)啻翁岬絊SE4指令集,相信很多消費(fèi)者對(duì)其還非常陌生,究竟是何方神圣能夠?yàn)镮ntel處理器帶來(lái)如此大的改進(jìn)呢?下面就讓我們來(lái)了解一下這款什么的指令集吧!
Intel Intel SSE4 指令包括矢量化編譯器和媒體加速器指令
SSE4的英文全稱是:Streaming SIMD Extensions 4,是英特爾自從SSE2之后對(duì)ISA擴(kuò)展指令集最大的一次的升級(jí)擴(kuò)展。新指令集增強(qiáng)了從多媒體應(yīng)用到高性能計(jì)算應(yīng)用領(lǐng)域的性能,同時(shí)還利用一些專用電路實(shí)現(xiàn)對(duì)于特定應(yīng)用加速。
從指令數(shù)目上看,SSE4指令增加了的指令改進(jìn)了整數(shù)和浮點(diǎn)操作,支持DWORD和QWORD操作,新的單精度FP操作、快速寄存器操作、面向性能優(yōu)化的內(nèi)存操作等等,包括了圖形、圖像、數(shù)據(jù)裝載各方面的革新,因此稱其為SSE2以來(lái)最大的指令集變動(dòng)也是不為過(guò)的。利用支持SSE4指令集的編譯器編譯之后,包括圖形/圖像處理、視頻處理、2D/3D創(chuàng)作、多媒體、游戲、內(nèi)存敏感負(fù)載、高性能計(jì)算等應(yīng)用都會(huì)受益。
SSE4指令集將分為兩個(gè)版本:4.1和4.2,SSE4.1版本隨著45nm Penryn發(fā)布,而SSE4.2版本將會(huì)隨著下一代架構(gòu)Nehalem發(fā)布,4.1將包括47條指令,4.2將包括7條指令。
技術(shù)領(lǐng)先 強(qiáng)大的SSE4指令集解析
據(jù)Intel指出,在應(yīng)用SSE4指令集后,Penryn增加了2個(gè)不同的32Bit向量整數(shù)乘法運(yùn)算支持,引入了8位無(wú)符號(hào) (Unsigned)最小值及最大值運(yùn)算,以及16Bit 及32Bit 有符號(hào) (Signed) 及無(wú)符號(hào)運(yùn)算,并有效地改善編譯器效率及提高向量化整數(shù)及單精度代碼的運(yùn)算能力。同時(shí),SSE4 改良插入、提取、尋找、離散、跨步負(fù)載及存儲(chǔ)等動(dòng)作,令向量運(yùn)算進(jìn)一步專門化。
不僅如此,Intel SSE4指令集還進(jìn)一步增強(qiáng)訊編碼效果,例如可同時(shí)處理8個(gè)4-byte寬度的SAD(Sums of Absolute Differences)運(yùn)算,常用于新一代高清影像編碼如VC.1及H.264等規(guī)格中,令視頻編碼速度進(jìn)一步提升。因此在播放高清視頻的時(shí)候,即使在軟解的情況下也同樣游刃有余。
有效地改善編譯器效率及提高向量化整數(shù)及單精度代碼的運(yùn)算能力
SSE4 構(gòu)建于英特爾64 指令集架構(gòu) (Intel® 64 Instruction Set Architecture) (ISA),該架構(gòu)是開(kāi)發(fā) 32 位和 64 位應(yīng)用最為廣泛應(yīng)用的電腦架構(gòu)。Intel® SSE4 包含 54 條指令,主要分為兩類:矢量化編譯器和媒體加速器,以及高效加速字符串和文本處理。矢量化編譯器和媒體加速器可提供高性能的編譯器函數(shù)庫(kù),如封包(同時(shí)使用多個(gè)操作數(shù))整數(shù)運(yùn)算和浮點(diǎn)運(yùn)算,可生成性能優(yōu)化型代碼。此外,它還包括高度優(yōu)化的媒體相關(guān)運(yùn)算,如絕對(duì)差值求和、浮點(diǎn)點(diǎn)積和內(nèi)存負(fù)載等。矢量化編譯器和媒體加速器指令可改進(jìn)音頻、視頻和圖像編輯應(yīng)用、視頻編碼器、3D 應(yīng)用和游戲的性能。高效加速字符串和文本處理包含多個(gè)壓縮字符串比較指令,允許同時(shí)運(yùn)行多項(xiàng)比較和搜索操作。由此受益的應(yīng)用包括數(shù)據(jù)庫(kù)和數(shù)據(jù)采掘應(yīng)用,以及那些利用病毒掃描和編譯器等分析、搜索和模式匹配算法的應(yīng)用。
SSE4加入了6條浮點(diǎn)型點(diǎn)積運(yùn)算指令
SSE4加入了6條浮點(diǎn)型點(diǎn)積運(yùn)算指令,支持單精度、雙精度浮點(diǎn)運(yùn)算及浮點(diǎn)產(chǎn)生操作,且IEEE 754指令 (Nearest, -Inf, Inf, and Truncate) 可立即轉(zhuǎn)換其路徑模式,大大減少延誤,這些改變將對(duì)游戲及 3D 內(nèi)容制作應(yīng)用有重要意義。此外,SSE4加入串流式負(fù)載指令,可提高以圖形幀緩沖區(qū)的讀取數(shù)據(jù)頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,并可保持在臨時(shí)緩沖區(qū)內(nèi),讓指令最多可帶來(lái)8倍的讀取頻寬效能提升,對(duì)于視訊處理、成像以及圖形處理器與中央處理器之間的共享數(shù)據(jù)應(yīng)用,有著明顯的效能提升。
|
新聞熱點(diǎn)
疑難解答
圖片精選