另外索泰geforce rtx 4090 d trinity 月白带来的dlss 3本身也融合了reflex技术,可以更有效的降低游戏时候的系统响应延迟。比如在1080p分辨率下,索泰geforce rtx 4090 d trinity 月白能够让《cs2》、《apex英雄》等竞技游戏获得远高于显示器刷新率的帧率同时,还将系统延迟降低到10ms以下,这也是geforce rtx 40的传统艺能了。
ai与创作一把手
毋庸置疑,了24gb gddr6x 384-bit显存的索泰geforce rtx 4090 d trinity 月白厉害的地方还在于内容创作和生成式ai上的表现。例如近段时间火热的stable diffusion xl本身运行需要依靠transformer变换器和卷积神经网络实现,这两者均需要gpu进行大规模并行计算,这无疑是nvidia最擅长的事情。也正因为如此,近几年ai的飞速发展,很大程度上就是nvidia gpu技术发展所推进的。
其中stable diffusion xl在模型体量上相当stable diffusion 1.5扩大了3倍,从而导致计算的数据量提升,但也带来了更好的画质。这里以stable diffusion web ui + tensorrt进行配置,用更短的语言描述生成10张分辨率为768x768的星际航行图片,每次运算1张图片,即总共执行10次,采样步数设置为50。
文字描述部分为:epic space battle over a water planet, many ships, cinematic lighting, depth of field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting。通过记录时间,推算出每分钟推算图片效率,参考公式为60 / (totaltime / (batchsize * batchcount)) = images per minute。
得益于更大的内存,索泰geforce rtx 4090 d trinity 月白领先幅度是其他gpu无法比拟的,哪怕是rtx 4080 super也能有翻倍的提升,并且与rtx 4090相当接近。
而就在最近,ul benchmark旗下的procyon正式在ai image generation benchmark子项中加入了stable diffusion 1.5和stable diffusion xl支持,测试过程有效避免了初次运行时的数据干扰,让实际测试性能变得更具有参考性。
可以看到索泰geforce rtx 4090 d trinity 月白在ai image generation benchmark的stable diffusion 1.5和stable diffusion xl基准测试下,战斗力是非常惊人的。stable diffusion 1.5(fp16)可以做到1.299s/image,stable diffusion xl(fp16)则可以做到11.535s/image,也就是在短短数秒内就可以完成一张文生图,并且整体评分与rtx 4090差距不大,同时比rtx 4080 super,rtx 4070 ti super都拉出了明显的距离。
发表评论