彩电

阿里含光800 AI处理器在全球十大汽车芯片中亮相高调展现其在人物识别场景下的落地性能即使比GPU高

在2019年的杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋简短介绍了阿里的首款AI芯片含光800,这次发布引发了巨大的关注。今年的线上云栖有一个芯片设计发展现状与未来的论坛,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。

他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,实例名称是ebman1.24xlarge,最多支持8核NPU和96核vCPU,384G内存,网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,业务包括城市大脑,大图像视频审核、拍立淘等。”更引人关注的是含光800在具体应用中的表现。

尽管没有公开销售,但通过阿里云输出其性能。正如去年雷锋网文章所说,科技巨头自研芯片是因为内部大量数据驱动的AI需求,以及希望通过自研芯片来提升效率和性价比。周五的线上分享中,龙欣也表示,在电商应用、视觉应用、语音交互、自然语言理解、机器翻译等方面都有广阔的AI应用。

一个典型例子就是拍立淘,它需要透过一张图片,在4亿多商品中搜索,在30多亿张图片库中进行匹配,并根据用户习惯进行个性化推荐,这就需要很强的AI能力。因此,阿里希望通过自研的含光800从硬件到软件方案提升性价比。

除了深度优化CNN及视觉类算法,加速卷积和矩阵乘以及针对ResNet-50、SSD/DSSD、Faster-RCNN/Mask-RCNN/DeepLab等模型优化、高能效低延时、高密度计算与存储,以及软硬协同支持权重稀疏压缩等特点,还指令集支持可编程模型扩展。在Inception V4模型中,其处理帧率达到5000 FPS,比主流推理GPU性能加速11倍。在直播视频增强中,其直播视频增强性能为500 FPS,对比主流推理GPU性能加速10倍。在点播HDR中,其性能为66 FPS,比英伟达A100训练GPU10FPS高6.6倍。

虽然此次分享给出的场景还不够丰富,而且介绍比较简单,但这可能是由于当前紧张贸易关系让公司对于相关话题更加谨慎。此外,即便有强大的团队能够快速设计出一款芯片,大规模落地仍然需要很长时间,而这个过程软件发挥着直接作用,并且获得客户认可和采用并不容易。