1、华为昇腾生态
深度学习之前的配置都是:nvidia gpu / cpu + cuda + tensorflow/pytorch
后来老美禁止 nvidia 卖gpu芯片给我们,于是国内企业开始发力cpu和gpu硬件,成果丰硕,虽然与nvidia顶级gpu还有一些差距,但是也不错,为了尽快填补国内需求,我们的解决方案是国产gpu + cuda + tensorflow/pytorch
,本来用的好好的,然而敌人亡我之心不死,开始禁止我们使用 cuda ,它其实就是一个协议或者指令集,它连接底层硬件与上层机器学习框架即tensorflow/pytorch
,通过硬件和软件两个维度卡你,我们这么多年习惯了拿来主义,现在变得很被动。
值此危难之际,还是华为站了出来,硬件软件一起扛,硬件上推出了昇腾系列ai计算芯片 ascend910/ascend310
,就是专门用来计算的gpu芯片,软件上使用 cann(类比于cuda),然后推出机器学习框架异思mindspore
(对标tensorflow/pytorch
),同时mindspore
也是开放的,它支持基于 cuda 的 gpu 以及普通的 cpu芯片,当然mindspore
也是使用 python 来开发,还提供一个 mindstudio 全流程开发工具链。官网 https://www.mindspore.cn/,也就是说华为昇腾是一个完整的生态,不再受外界掣肘。
有资料显示ascend910性能与nvidia-a100相当,这其实很牛逼了,要知道英伟达发展了多少年,我们才多少年。
在人工智能框架使用率方面,tensorflow、pytorch、昇思mindspore和飞桨合计占了86%的市场份额,其中,mindspore以11%的占比在全球框架里排名第三,逆势进入了ai框架的第一梯队。
2、昇腾当前有哪些不足:
当前昇腾需求的爆发式增长动力主要来自1)ai算力行业自身的快速增长;2)国内自主可控的替代,比如说国家级别的人工智能计算中心,大部分开始会采用昇腾。
当相比于英伟达目前也有不少核心问题:
1,昇腾只能用于华为自身生态中的大模型业务,比如昇腾不能做gpt-3,因为910不支持32位浮点,**而目前大模型训练几乎都要使用32位的浮点,所以昇腾芯片只能利用华为开发的框架(如mindspore),再加上优化好的大模型,比如盘古cv。
2,生态依然需要完善。英伟达最强大的护城河在于它的生态系统cuda。目前cann还有差距。
3,先进制程的卡脖子问题得到了一定解决,但依然需要担忧产能问题。
发表评论