行业动态

阿里含光800 AI处理器高调亮相犹如一位舞者轻盈跃上舞台它在三大场景中的演绎力不仅让GPU望尘莫及

在2019年的云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋隆重发布了公司的首款AI芯片——含光800,这款当时最强大的AI推理芯片的问世,让人瞩目的高调亮相。经过一年多的时间,阿里云异构计算产品研发总监龙欣在今年的线上云栖大会中分享了含光800近一年来的最新进展。

他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买。”这款芯片拥有8核NPU和96核vCPU、384G内存以及网络带宽最高达到30Gbit/s,是针对数据中心CNN类型模型推理加速而设计,主要应用于城市大脑、图像视频审核以及拍立淘等业务。

更值得关注的是,含光800在实际应用中的表现。在电商领域,如拍立淘,它需要通过一张图片,在4亿多商品中搜索,并且进行个性化推荐,这种强大的AI能力是由含光800提供支持。此外,该芯片还具有深度优化CNN及视觉类算法、高能效、低延时、高密度计算与存储,以及软硬协同支持权重稀疏压缩和量化压缩等特点。

尽管去年发布时宣称其业界标准ResNet-50测试性能为78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍,但是在昨天的分享中并未提及具体峰值性能,而是强调其可用性。龙欣表示:“作为并没有在公开市场发售的芯片,通过阿里云输出。”

为了让用户能够快速使用含光800,阿里云提供自动安装NPU驱动和SDK,还预装主流深度学习框架,如TensorFlow、MXNet,并提供示范教程。据龙欣介绍,在行人检测应用中,与主流GPU相比,其性能提升了4倍;车辆检测则提升8.5倍;而对于ResNet50 V2模型,其帧率达到了20000 FPS,比主流推理GPU速度快11倍;Inception V4模型处理帧率达到5000 FPS,比主流GPU快10.8倍。此外,对于直播视频增强,它实现了10倍以上的性能加速。

尽管此次分享给出的数据并不全面,但它清楚地展示了包含400万日活用户的大型端口APP如何利用该技术进行个性化推荐。而随着贸易紧张关系可能影响企业对此类话题敏感性的增加,此次会议上的关注度并不如去年那么高。不过,从软件到硬件再到实际应用落地,这是一个长期且复杂过程,其中软件发挥着关键作用。