当前位置: 代码网 > it编程>操作系统>苹果Mac > 自动驾驶芯片指标AI算力TOPS和CPU算力DMIPS

自动驾驶芯片指标AI算力TOPS和CPU算力DMIPS

2024年08月01日 苹果Mac 我要评论
DMIPS(Dhrystone Million Instructions Per Second,每秒处理的百万级的机器语言指令数),描述的是CPU的运算能力。GPU (Graphics Processing Unit):图形处理器,有大量的并行处理单元(如Nvidia RTX 4090有16384核),主要用于图像处理和并行计算(如图像渲染、深度学习和密码学等)。准确点讲,TOPS描述的是芯片MAC(Multiply Accumulate,乘积累加运算)的运算能力。FP16: 半精度浮点数/16位浮点数。

自动驾驶芯片指标ai算力tops和cpu算力dmips

智能驾驶芯片

根据地平线数据,

l2级自动驾驶的算力需求为2-2.5tops,

l3级自动驾驶算力需求为20-30tops,

l4级自动驾驶算力需求为200tops以上,

l5级自动驾驶算力需求为2000tops以上。

厂商智驾芯片ai算力tops(int8)量产时间
华为mdc8104002022
华为mdc6102002022
英伟达orin2542019
英伟达xavier302020
特斯拉fsd 1.0722019
特斯拉fsd 2.0预估400-5002023
地平线征程51282022
黑芝麻a1000 pro1062022
mobileyeeyeq5242021
车型智驾芯片ai算力tops座舱芯片cpu算力dmipsgpu算力tflopsai算力tops
阿维塔12华为mdc810400麒麟9610a?200k/30?
问界m7智驾华为mdc610200麒麟990a?80k7683.5
蔚来et7nivida orin-x *41016高通815585k11424
小鹏g9nivida orin-x *2508高通815585k11424
理想l9 maxnivida orin-x *2508高通815585k11424
理想l9 pro地平线征程5128高通815585k11424
特斯拉model3fsd *2144amd ryzen///
极越01nivida orin-x *2508高通8295220k>300030

cpu gpu npu

cpu (central processing unit):中央处理器,是计算机系统的主要处理器,负责多数的通用计算任务。【通用】

gpu (graphics processing unit):图形处理器,有大量的并行处理单元(如nvidia rtx 4090有16384核),主要用于图像处理和并行计算(如图像渲染、深度学习和密码学等)。【专用】

npu (neural network processing unit):神经网络处理器,具有高度优化的硬件和指令集,主要用于加速机器学习和人工智能应用。【专用】

算力单位tops

tops (tera operations per second),表示每秒执行1万亿次(10^12)运算,用于衡量自动驾驶芯片的ai算力。

准确点讲,tops描述的是芯片mac(multiply accumulate,乘积累加运算)的运算能力。

注意,tops并没有指定数据类型,具体算力评估需要结合数据类型及精度。

注意,tops不是衡量处理器的唯一标准,实际应用中还需要考虑处理器的功耗、内存带宽、存储容量等。

乘积累加运算mac

乘积累加运算(multiply accumulate,mac)包括相乘和相加两个过程(a←a+b*c),实现该运算的专门硬件电路单元,被称为“乘数累加器”。这样用一个mac指令就可以完成原来两个指令的操作。对于卷积运算、点积运算、矩阵运算、数字滤波器运算、乃至多项式的求值等运算而言,mac指令可以大幅提高运算效率。如自动驾驶深度学习等算法的核心运算就是矩阵运算,矩阵运算可以分解为数个mac运算,从而提升效率。

tops计算公式

tops计算公式如下:

理论峰值 = mac矩阵行 * mac矩阵列 * 主频 * 2

举例:

特斯拉的fsd芯片,96x96 mac,主频2ghz

tops = 96 * 96 * 2000000000 * 2 = 36.864 tops

gpu算力tflops

tflops(tera floating-point operations per second),表示每秒执行一万亿次浮点运算。

tflops计算公式如下:

理论峰值 = 单核单周期浮点计算次数 × 处理器核数 × 主频

举例:

gtx680, 单核单周期浮点计算次数为两次,处理核个数 为1536, 主频为1006mhz

tflops = 2 × 1536 × 1006mhz = 3.09tflops

tflops与tops的换算

1tflops@fp16 ≈ 2 * 1tops@int8

fp16: 半精度浮点数/16位浮点数

int8: 8位整数精度

cpu算力dmips

dmips(dhrystone million instructions per second,每秒处理的百万级的机器语言指令数),描述的是cpu的运算能力。自动驾驶中多传感器融合的滤波算法,激光点云的配准算法,多数的路径规划和决策算法与dmips密切相关。

dmips通过处理器cpu性能测试基准dhrystone程序进行评分。


reference:

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com