七、架构解析之三大核心与型号
图灵家族除了架构本身变化巨大,产品体系也和以往明显不同,首发一口气就是三款型号rtx 2080 ti、rtx 2080、rtx 2070,而且分别对应三个不同核心tu102、tu104、tuf106,而以往的x80、x70都是共享一个核心。
具体原因不详,可能是新一代核心太大,x70直接用大核心阉割成本比较高,还不如再造一个省钱的小核心。

这就是最顶级的tu102核心,186亿个晶体管、754平方毫米面积确实不是盖的。
内有4608个cuda核心,分为6组gpc、36组tpc、72组sm阵列(每组sm 64个cuda核心),同时有72个rt核心、576个tensor核心、288个纹理单元、96个rop光栅单元,二级缓存容量6mb,寄存器文件18mb,352-bit位宽。

不过,rtx 2080 ti并未完全使用整个tu102核心,而是有所精简,仅提供4352个cuda核心(68组sm阵列),rt核心则减少为68个,tensor核心544个。
目前只有quadro rtx 8000用了完整的tuf102,可能是初期良品率不足,优先供给专业市场,也可能是功耗和发热在游戏卡上不好控制,还有可能是留一手……
rtx 2080 ti的核心频率基础为1350mhz,加速频率fe公版做到了1635mhz,非公版则规定是1545mhz,当然大家可以随意超频。
显存搭配11gb gddr6,等效频率14ghz,带宽为616gb/s,整卡功耗260w。

tu104核心,136亿个晶体管,545平方毫米,比帕斯卡家族的大核心gp102都要大一圈。
它集成了3072个cuda核心,划分为6组gpc、24组tpc、48组sm(每组sm还是64个),同时有192个纹理单元、64个rop单元、384个tensor核心、48个rt核心,二级缓存容量4mb,寄存器文件12mb,显存位宽256-bit。

rtx 2080同样没有用满tu104核心,而是精简了两组sm,提供2944个cuda核心、368个tensor核心、46个rt核心,完整版还是在专业卡上,quadro rtx 6000。
rtx 2080核心基础频率1515mhz,加速频率非公版1710mhz,公版直接定在1800mhz,搭配8gb gddr6显存,等效频率14ghz,带宽448gb/s,功耗225w。
它的渲染性能为60 trx-ops,相比于rtx 2080 ti削弱了23%,光线追踪性能8 gigarays/s(每秒80亿条光线),削弱了20%。

tu106核心,108亿个晶体管,445平方毫米,相比gp102也只是分别差了10%、6%,更可见图灵家族的庞大。
tu106核心內建2304个cuda核心,分为3组gpc、18组tpc、36组sm阵列(每组继续64个),同时有144个纹理单元、64个rop单元、288个tensor核心、36个rt核心,二级缓存容量4mb,寄存器文件9mb,显存位宽还是256-bit。

rtx 2070终于用了完整的tu106核心,核心频率基础1410mhz,加速公版1710mhz、非公版1620mhz,继续搭配8gb 14ghz gddr6显存,功耗185w。
渲染性能45 rtx-ops,相比于rtx 2080 ti、rtx 2080分别低了25%、42%,光线追踪性能6 gigarays/s(每秒60亿条光线),分别低了25%、40%。

图灵家族三大核心与帕斯卡家族大核心gp102对比。
发表评论