CPU处理器那边迎来了近十年最热闹的场面,一直飞速发展的GPU显卡也不甘寂寞,AMD全新的高性能大核心Vega终于快出来了。
而就在这个时候,NVIDIA放出了终极杀招——真正核弹级别的旗舰GeForce GTX 1080 Ti隆重登场!“钛”字金招牌再现江湖!
NVIDIA这一代“帕斯卡”(Pascal)家族无论各方面表现都十分优秀,性能突出,能耗更低,产品普及也非常快,已经几乎完全铺满了桌面、笔记本、高性能计算、图形工作站等各个领域,延续了强势表现。
在桌面上,此前的旗舰可以说是Titan X,拥有无比豪华的规格,但一方面它主要是针对高性能计算而生的,强调浮点精度计算,而且价格高达9499元,还不开放非公版,第三方厂商基本没有,所以市面上几乎买不到。
GTX 1080 Ti就不一样了,它是真正的游戏旗舰卡,规格彪悍,黄仁勋在发布时就直言,其性能已然超越Titan X,着实疯狂!
它的价格“只要”5699元,更关键的是产品丰富,各家的非公版都已经第一时间迫不及待地露面,未来价格空间也更有弹性。
对于那些追求极致的游戏玩家而言,这才是上上之选。
【它是怎么超越Titan X的?】
GTX 1080 Ti采用了和Titan X相同的GP102大核心,同样有3584个流处理器,分为28组SM(流处理器阵列),相比于GTX 980 Ti 2816个猛增了27%。
但即便是这样的旗舰卡,NVIDIA依然没有给它真正开足马力——GP102核心其实拥有30组SM、3840个流处理器,这里还是隐藏了两组256个,只有在GP100那样的专业卡上,才能看到满血的GP102。
而按照目前的产品布局和市场形势,桌面玩家恐怕是不可能再得到完整的GP102核心了。
帕斯卡架构专为高频率做了优化,GTX 1080 Ti也丝毫不弱,核心基础频率1480MHz、加速频率1582MHz(甚至有能力超过2GHz),不仅比GTX 980 Ti提高了几乎50%,也略高于Titan X 1471-1531MHz。
它还有224个纹理单元,加速频率下纹理填充率高达354.4GT/s,比上代猛增超过85%。
显存方面,NVIDIA独家拥有GDDR5X,GTX 1080 Ti更是搭配了新一代芯片,等效频率高达恐怖的11GHz,创造了一个历史记录。
为了获得这么高的速度,NVIDIA与供应商紧密合作,使用高级均等化技术降低物理界面的不利影响,抖动和电噪音也压到了最低,使得信号传输更加纯净。
这幅对比图中,左侧是原有的GDDR5X跑在11GHz,可以看到信号图中央部位有大量杂乱信号,显然会干扰数据传呼,而右侧的新一代GDDR5X 11GHz就好多了。
GTX 1080 Ti的显存位宽为352位——一个奇怪的数字,相比于Titan X砍掉了32位——结合11GHz高频率可以带来484GB/s的有效带宽,直逼HBM。
另外,帕斯卡架构还可以将原始显存带宽进一步扩大,获得更多有效带宽,比如大家都熟悉的显存压缩。
比如新的“Tiled Caching”(暂译区块缓存)。
GPU架构目前有两种主流渲染方式,一是高端桌面GPU常用的立即渲染模式(Immediate Renderng),二就是移动GPU喜欢的区块渲染/平铺式渲染(Tiled Rendering)。
立即渲染模式下,输入的每一条指令都会顺序执行,比如要绘制一个三角形,那就把它画完再进行下一步工作。
这样做的好处是只需一次性读取输入几何数据,输入内容更灵活而不会耗尽资源,但缺点是在高度重叠的区域(比如分层的云彩),同样的像素往往会多次读写,浪费显存带宽。
区块渲染,顾名思义就是将画面分割成多个单独的区块,分两步渲染。首先,根据几何数据决定每个三角形覆盖的区块,将此信息写入显存;然后,每个区块单独进行几何处理,每渲染完一个区块,再进行下一个,整个过程都在GPU上机型,只有最终色彩才会写入显存。
这种渲染方式有两大局限,一是会增加驱动延迟和复杂性, 其二也是更关键的,对显存带宽的控制要求极高,所以传统上只有移动GPU才用它,比如Imagination PowerVR、ARM Mali。
NVIDIA在上代麦克斯韦架构中就加入了区块渲染技术,帕斯卡架构中进一步强化,但直到现在才公开部分细节。
简单地说,NVIDIA使用了一种新的混合渲染方式,仍以立即渲染为主,但在渲染流水线中加入了一个“binner”,负责向二级缓存(2816KB)写入片上几何队列,数据量满足特定缓存大小后就会进行渲染,逐个区块进行,直到队列处理完毕。
这就是所谓的Tiled Caching,利用区块光栅化改进二级缓存的有效性,相比传统区块渲染架构,可以节省类似的像素带宽,但不会损害几何带宽或者增加延迟。
再加上新的无损4:1、8:1 Delta颜色压缩模式,包括GTX 1080 Ti在内的帕斯卡家族成员可以大大减少需要从现存中提取送给GPU的数据量。
按照NVIDIA的说法,以上各种技术结合起来,GTX 1080 Ti能将有效显存带宽翻一番还多,几乎有1.2GB/s。
显存容量方面,NVIDIA选择了11GB,正好配合352位的位宽,每32位对应一颗1GB颗粒。
这也是一个新高度,NVIDIA号称可以轻松满足的当今游戏大作在5K分辨率下的要求。
NVIDIA表示,GTX 1080 Ti相比于GTX 1080的平均游戏性能提升幅度高达35%,是近几年类似产品之间最大的进步。
上一页 1 2345下一页