游戏显卡的江湖上流传着这样的传说,凡是n卡豪门旗下披着6号战袍的产品都会拥有着异常火爆的市场表现。这一规律被称为“逢6必火”定律。自从nvidia推出6600gt以来,几乎每一代带“6”的显卡都大火特火了起来。但上一代gtx 960由于一些问题最终没有大火特火起来让n粉们有些失望,而最近发布的新一代帕斯卡中端显卡 gtx 1060是否能捡起旧日的荣光,重新续写“逢6必火”的传奇呢?

2016年5月,nvidia发布了最新一代的帕斯卡架构产品,并且使用了16nm finfet工艺制造。同时发布的gtx 1080和gtx 1070都表现出了巨大的性能提升,而作为传统意义上的主流产品,gtx 1060直到两个月后的7月初才低调发布。

在nvidia发布gtx 1060之前老对手amd已经祭出了自己的主流显卡rx 480,让这一价位的争夺成为了再一次的n/a大战的首次交火。作为这一代的nvidia中端主力型号,gtx 1060又有怎样的战斗力呢?
●gtx1060规格参数:

规格点评:gtx1060显存升级到6gb,已经比gtx980的4g都更高了,对于vr应用来说,大显存相当有必要。流处理器数方面,gtx1070比gtx1080少了640个,1/4也就是一组的量,而gtx1060也是比gtx1070少了640个,剩1280了,但也比同定位的gtx960要多了;显存位宽终于回归到192bit,位宽缩得太多一直是gtx960被喷的点,因此猜测应该就不会有gtx1060ti了(但很可能会有1050ti)。基础频率也是很高,1.5ghz比gtx960足足高了50%,加速频率也达到了1.7ghz,老黄帕斯卡这代的频率扯真心高。纹理单元和rops也是gtx1070略为缩减,但减的都不是太多,换来的是更低的功耗,仅120w,6pin供电完全够用.
pascal gp106核心解析
nvidia在经历了四年基于28nm finfet制造工艺制造gpu的漫长历史以后,基于pascal gp104的geforce gtx 1080首次迎来了16nm finfet制造工艺升级。更高精度的“光刻”工艺允许gpu在单位面积的芯片上集成更多数量的晶体管,在同样的核心架构中,更加庞大的核心规模就意味着更强大的处理性能。所以16nm finfet制造工艺能够给nvidia新显卡带来的能效提升是可以预见的,但是一直在超越自己的nvidia并没有被动享受制程进步的红利,反而在新一代的显卡中使用了更为先进的技术。这其中就包括gtx 1060使用的gp106核心。

gtx 1060的gp106核心内建2组gpc和6个显存控制器,每个gpc包含5个sm,1个sm中集成了128个cuda单元、8个纹理单元、256kb的二级缓存、96kb的共享储存空间以及48kb的一级缓存。从规格上来看,gp106更像是gtx 1080所使用的gp104核心在除显存控制器之外其它多数规格砍掉一半而成的。

sm流式多处理器能够高度协调其中的cuda核心以及其他功能元件的工作,这20个sm会参与到几乎所有gpu执行的所有命令中。geforce gtx 1080拥有8个位宽为32bit的显存控制器,每一个显存控制器配有八个rop单元和256 kb二级缓存。所以,完整gtx 1080的gp104核心共有2560个cuda单元、256bit显存位宽、64个rop、160个tmu以及2mb二级缓存。

gp106的核心晶体管数量为44亿,核心面积为200 mm2,略小于麦克斯韦家族gm206的227mm2,得益于16nm finfet工艺的应用,每平方毫米的晶体管数量达到了22.9m,远远高于gm200。这也是gp106以及其它pascal架构显卡能耗比如此高效的主要原因之一。此外,cuda数量1280个,rops数量48个,tmus数量80个。

nvidia将gpu开发工作的重点放在了设计pascal核心架构的每一个细节中。pascal之所有能够成为有史以来能效最高的gpu,原因不仅仅是16nm finfet带来的制造工艺精进,更得益于持续提高的核心效率。nvidia工程团队的一大精力投入重点是gpu核心运行频率,橡木桶定律那样,gpu核心运行频率是由数以百万计的设计电路中速度最慢的那一路径决定的,所以这一最慢路径的优化对于gpu核心运行频率的提高是至关重要的。经过nvidia工程团队在这一领域的不断钻研,pascal架构gpu相比前代有着40% 的运行效率提升。单靠16nm finfet的制造工艺,是不能够带来如此高比例的核心频率提升的。
smp技术和ansel工具介绍

多画面同步投射技术(smp),可以让基于pascal架构核心的gpu以16个角度渲染画面并分别呈现。为了实现多画面同步投射技术,nvidia在pascal架构核心的gpu中集成了新的多画面同步投射引擎模块。

smp单元负责在渲染一个画面之前,生成多个视角再分别交给cuda及其他元件进行渲染。smp可用于许多新的图形技术,列如环绕透视、镜头阴影的匹配、单通道虚拟现实vr,多分辨率渲染。

这些新的图形技术对于虚拟现实vr有着颇多的益处,能够带来多达1.5倍的像素输出量和2倍以上的几何图形输出量。
发表评论