热点资讯

千亿芯片大骗局阿里含光800 AI处理器震撼亮相GPU比拼三大场景性能高出4-11倍

在2023年的阿里云栖大会上,公司首席技术官兼阿里云智能总裁张建锋再次亮相,他的演讲中回顾了2019年发布的含光800 AI处理器,这款当时最强大的AI推理芯片的高调亮相。自那以后,一年过去了,张建锋带来了新的进展报告。

这次,张建锋介绍了含光800 NPU实例已经正式对外服务,不需要任何白名单限制,就可以在阿里云实例上购买。它支持8核NPU和96核vCPU、384G内存以及最高30Gbit/s网络带宽。这使得城市大脑、图像视频审核以及拍立淘等业务能够得到极大的加速。

更令人关注的是,在具体应用中的表现。尽管含光800尚未对外发售,但其性能已通过阿里云输出。在电商应用、视觉应用、语音交互和自然语言理解等方面,包括拍立淘这样的典型应用,它提供了强大的AI能力来帮助用户快速搜索商品并进行个性化推荐。

为了提升性价比,含光800采用深度优化CNN及视觉类算法,加速卷积和矩阵乘,以及针对ResNet-50、SSD/DSSD等模型优化。同时,它具有高能效、高密度计算与存储以及软硬协同支持权重稀疏压缩和量化压缩功能。此外,还有指令集支持可编程模型扩展,以便未来新型激活函数的适应性。

去年发布时,张建锋宣称在业界标准的ResNet-50测试中,其推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;而能效比500 IPS/W,是第二名的3.3倍。不过今年龙欣分享时并未提及峰值性能,而是强调其可用性,并且表示包含自动安装NPU驱动和SDK,以及预装主流深度学习框架如TensorFlow、MXNet等系统支持。

至于具体数据,比起GPU来说,在三大AI应用中的性能提升为4-11倍。在行人检测中,可支持100路视频;车辆检测中,可支持85路视频;而直播内容识别使用ResNet50 V2模型,可达20000 FPS,与主流GPU相比提升11倍。在点播HDR场景下,则实现6.6倍的性能加速比。

虽然今年对于含光800关注度不如去年,但实际应用优势仍然是许多人所关心之处。而即便如此,对于一个科技巨头自研芯片的大规模落地还需时间,而且软件在这个过程中的作用尤为关键。不难看出,阿里的芯片之路依旧只是刚开始阶段。而关于他们下一代AI芯片何时推出,我们不得而知,只能期待以后的发展。