Nvidia在之前的GTC大會上正式發布了全新一代的計算卡Tesla P100,這也是世界上首款采用Pascal架構的計算卡,那么對于這么一塊計算卡來說,它的性能如何呢?下面就詳情來看看相關評測吧!
GTX 1080/1070雖然性能很強悍,但它們在全新的帕斯卡家族中只能算是中檔水準,真正的大殺器是頂級大核心GP100,擁有3840個FP32單精度、1920個FP64雙精度CUDA核心,主要面向高性能計算領域。
擔任首發的Tesla P100(似乎也叫Tesla P1),只開啟了3584個單精度、1792個雙精度核心,即便如此單、雙精度浮點性能也高達10.6TFlops、5.3TFlops,同時還搭配了4096-bit 16GB HBM2高帶寬顯存,并支持全新的NVLink互連總線,取代傳統PCI-E。
那么它到底性能如何呢?圣地亞哥超級計算中心的Scott Le GrandRoss Walker、亞馬遜網絡服務的Scott Le Grand聯合編寫了一個通用計算測試工具AMBER,可模擬生物分子周圍的力場,并與NVIDIA合作對Tesla P100進行了一番測試,包括單路、雙路、四路。
由于測試所用硬件還是工程樣品,操作系統是Linux,而且測試工具和測試方法是專門為了考察純粹計算性能而設計的,所以結果反映的只是純計算能力,和游戲表現無關。
事實上,GP100核心應該永遠不會出現在消費級領域,GTX 1080 Ti、GTX Titan X 2之類的頂級卡會使用GP102。
參與對比的產品中,Tesla M40基于麥克斯韋架構大核心GM200,3072個流處理器,單精度性能突破7TFlops,雙精度只有0.21TFlops,搭配384-bit 12GB GDDR5顯存。
Tesla K80使用的是兩個開普勒架構大核心GK210,4992個流處理器,單雙精度浮點性能8.74、2.91TFlops,搭配兩組384-bit 12GB GDDR5。
Tesla K40的核心是GK110,2880個流處理器,單雙精度浮點性能4.29、1.43TFlops,搭配384-bit 12GB GDDR5。
GTX 1080、Titan X、980 Ti、980也都加入了對比,另外還有幾顆純CPU,包括雙路的E5-2697 v4/2698 v3/2650 v3,分別有32/32/20個核心。
具體測試原理、流程啥的就不多說了,專業性太強,只簡單看看結果:
相比于前輩M40,P100的計算性能提升相當猛,絕大部分項目都在50%左右,少數甚至超過80%,有的甚至接近100%!
事實上在大部分時候,單路P100都能干掉雙路M40,領先幅度10-20%不等。
對比消費級游戲卡,P100單路已經相當于GTX Titan X四路的水準,也可以看到GTX 1080同樣十分兇猛,多數情況下都達到或者接近M40的水平,但不夠穩定,有時候相當于單塊Titan X,有時候超過人家兩塊。
最遺憾的是,NV-Link總線的威力還沒有發揮出來,雙路、四路P100的提升幅度普遍還不如PCI-E。
八路Tesla P100
綜上的就是武林網匯總的關于NVIDIA Tesla P100計算卡性能首發評測,大家可以參考學習一下,希望會對大家有所幫助!歡迎大家繼續關注其他信息!
新聞熱點
疑難解答
圖片精選