CPU處理器那邊迎來了近十年最熱鬧的場面,一直飛速發展的GPU顯卡也不甘寂寞,AMD全新的高性能大核心Vega終于快出來了。
而就在這個時候,NVIDIA放出了終極殺招——真正核彈級別的旗艦GeForce GTX 1080 Ti隆重登場!“鈦”字金招牌再現江湖!
NVIDIA這一代“帕斯卡”(Pascal)家族無論各方面表現都十分優秀,性能突出,能耗更低,產品普及也非常快,已經幾乎完全鋪滿了桌面、筆記本、高性能計算、圖形工作站等各個領域,延續了強勢表現。
在桌面上,此前的旗艦可以說是Titan X,擁有無比豪華的規格,但一方面它主要是針對高性能計算而生的,強調浮點精度計算,而且價格高達9499元,還不開放非公版,第三方廠商基本沒有,所以市面上幾乎買不到。
GTX 1080 Ti就不一樣了,它是真正的游戲旗艦卡,規格彪悍,黃仁勛在發布時就直言,其性能已然超越Titan X,著實瘋狂!
它的價格“只要”5699元,更關鍵的是產品豐富,各家的非公版都已經第一時間迫不及待地露面,未來價格空間也更有彈性。
對于那些追求極致的游戲玩家而言,這才是上上之選。
【它是怎么超越Titan X的?】
GTX 1080 Ti采用了和Titan X相同的GP102大核心,同樣有3584個流處理器,分為28組SM(流處理器陣列),相比于GTX 980 Ti 2816個猛增了27%。
但即便是這樣的旗艦卡,NVIDIA依然沒有給它真正開足馬力——GP102核心其實擁有30組SM、3840個流處理器,這里還是隱藏了兩組256個,只有在GP100那樣的專業卡上,才能看到滿血的GP102。
而按照目前的產品布局和市場形勢,桌面玩家恐怕是不可能再得到完整的GP102核心了。
帕斯卡架構專為高頻率做了優化,GTX 1080 Ti也絲毫不弱,核心基礎頻率1480MHz、加速頻率1582MHz(甚至有能力超過2GHz),不僅比GTX 980 Ti提高了幾乎50%,也略高于Titan X 1471-1531MHz。
它還有224個紋理單元,加速頻率下紋理填充率高達354.4GT/s,比上代猛增超過85%。
顯存方面,NVIDIA獨家擁有GDDR5X,GTX 1080 Ti更是搭配了新一代芯片,等效頻率高達恐怖的11GHz,創造了一個歷史記錄。
為了獲得這么高的速度,NVIDIA與供應商緊密合作,使用高級均等化技術降低物理界面的不利影響,抖動和電噪音也壓到了最低,使得信號傳輸更加純凈。
這幅對比圖中,左側是原有的GDDR5X跑在11GHz,可以看到信號圖中央部位有大量雜亂信號,顯然會干擾數據傳呼,而右側的新一代GDDR5X 11GHz就好多了。
GTX 1080 Ti的顯存位寬為352位——一個奇怪的數字,相比于Titan X砍掉了32位——結合11GHz高頻率可以帶來484GB/s的有效帶寬,直逼HBM。
另外,帕斯卡架構還可以將原始顯存帶寬進一步擴大,獲得更多有效帶寬,比如大家都熟悉的顯存壓縮。
比如新的“Tiled Caching”(暫譯區塊緩存)。
GPU架構目前有兩種主流渲染方式,一是高端桌面GPU常用的立即渲染模式(Immediate Renderng),二就是移動GPU喜歡的區塊渲染/平鋪式渲染(Tiled Rendering)。
立即渲染模式下,輸入的每一條指令都會順序執行,比如要繪制一個三角形,那就把它畫完再進行下一步工作。
這樣做的好處是只需一次性讀取輸入幾何數據,輸入內容更靈活而不會耗盡資源,但缺點是在高度重疊的區域(比如分層的云彩),同樣的像素往往會多次讀寫,浪費顯存帶寬。
區塊渲染,顧名思義就是將畫面分割成多個單獨的區塊,分兩步渲染。首先,根據幾何數據決定每個三角形覆蓋的區塊,將此信息寫入顯存;然后,每個區塊單獨進行幾何處理,每渲染完一個區塊,再進行下一個,整個過程都在GPU上機型,只有最終色彩才會寫入顯存。
這種渲染方式有兩大局限,一是會增加驅動延遲和復雜性, 其二也是更關鍵的,對顯存帶寬的控制要求極高,所以傳統上只有移動GPU才用它,比如Imagination PowerVR、ARM Mali。
NVIDIA在上代麥克斯韋架構中就加入了區塊渲染技術,帕斯卡架構中進一步強化,但直到現在才公開部分細節。
簡單地說,NVIDIA使用了一種新的混合渲染方式,仍以立即渲染為主,但在渲染流水線中加入了一個“binner”,負責向二級緩存(2816KB)寫入片上幾何隊列,數據量滿足特定緩存大小后就會進行渲染,逐個區塊進行,直到隊列處理完畢。
這就是所謂的Tiled Caching,利用區塊光柵化改進二級緩存的有效性,相比傳統區塊渲染架構,可以節省類似的像素帶寬,但不會損害幾何帶寬或者增加延遲。
再加上新的無損4:1、8:1 Delta顏色壓縮模式,包括GTX 1080 Ti在內的帕斯卡家族成員可以大大減少需要從現存中提取送給GPU的數據量。
按照NVIDIA的說法,以上各種技術結合起來,GTX 1080 Ti能將有效顯存帶寬翻一番還多,幾乎有1.2GB/s。
顯存容量方面,NVIDIA選擇了11GB,正好配合352位的位寬,每32位對應一顆1GB顆粒。
這也是一個新高度,NVIDIA號稱可以輕松滿足的當今游戲大作在5K分辨率下的要求。
NVIDIA表示,GTX 1080 Ti相比于GTX 1080的平均游戲性能提升幅度高達35%,是近幾年類似產品之間最大的進步。
新聞熱點
疑難解答
圖片精選