在《黑神话·悟空》中,2k分辨率影视级画质下测试,关闭dlss帧生成,测试成绩为平均帧率50帧/秒,最低38帧/秒,95%帧率高于42帧/秒。
保持2k分辨率影视级画质下测试,打开dlss帧生成,测试成绩为平均帧率85帧/秒,最低69帧/秒,95%帧率高于74帧/秒。
2、《赛博朋克:2077》
在《赛博朋克:2077》中,2k分辨率光线追踪:超速画质下测试,关闭dlss帧生成,测试成绩为平均帧率71.03fps,最低63.61fps。
同样在2k分辨率光线追踪:超速画质下测试,打开dlss帧生成,测试成绩为平均帧率118.26fps,最低107.6fps。
3、《极限竞速:地平线5》
在极限竞速:地平线5中,使用2k分辨率极端画质测试,最终测试成绩为158fps。
4、《地平线:零之曙光》
在地平线:零之曙光中,使用2k分辨率和终极质量画质测试,最终测试成绩为194fps。
5、《古墓丽影:暗影》
在古墓丽影:暗影中,使用2k分辨率和最高画质测试,关闭dlss,平均帧率220。
在古墓丽影:暗影中,使用2k分辨率和最高画质测试,打开dlss,平均帧率272。
对比rtx 3080ti显卡,可以看到老一些的游戏普遍都有20%左右的帧数性能提高,新游戏则由于支持dlss3,性能提高非常显著。
《黑神话·悟空》开启dlss超分辨率采样之后,3080ti就无法打开帧生成功能,而《赛博朋克》使用3080ti直接就无法启用dlss。
相信随着支持dlss3的游戏越来越多,rtx 3080ti和影驰geforce rtx 4070ti super 金属大师plus oc显卡的差距只会越来越大。
五、ai和生产力性能测试:对比3080ti全面提升超20%
1、ul procyon
在本地侧端体验部分,我们使用ul procyon作为基准测试,它支持对多种ai推理引擎和stable diffusion图像生成模型进行测试,并给出非常直观的结果,包含总分、总耗时、图片生成速度等数据、cpu和gpu型号以及跑分设置等信息。
其中ai image generation benchmark套件,包含了2个不同版本的stable diffusion模型构建的测试,分别为sd1.5和sdxl,在兼容性上支持tensorrt、openvivo、onnx runtime,也就是说支持主流的nvidia、intel、amd三大平台。
首先测试的是基于sd1.5(fp16)的ai image generation benchmark,在这个过程中每批次会创建4幅图像,共16幅,分辨率为512×512,干预步骤为100。
影驰geforce rtx 4070ti super 金属大师plus oc显卡得分为3497,stable diffusion 1.5的unet(神经网络架构)速度最高可达56.925it/s,平均只需1.787秒就能生成一张图像。
之后进行基于sdxl(fp16)的ai image generation benchmark测试,在这个过程中每批次会生成1张图像,总共会创建16幅图像,分辨率提升到1024×1024,干预步骤为100。
影驰geforce rtx 4070ti super 金属大师plus oc显卡得分为3128,stable diffusion xl的unet(神经网络架构)速度最高可达8.483it/s,平均只需11.987秒就能生成一张图像。
之后使用ai computer vision benchmark中的nvidia tensorrt测试项目来测试ai推力性能,精度设置为float32。
nvidia tensorrt 是一款用于在 nvidia 硬件上实现高性能推理的 sdk。tensorrt 使用经过训练的网络,然后从中生成一个优化后的运行时引擎。此 sdk 包括一个优化程序,可使用 nvidia 的不同优化工具,在其执行运行时启用快速推理,充分利用了 tensor cores 等 nvidia 硬件的优势。
发表评论