阿里含光800 AI处理器如同神奇之手高调亮相后在三大场景中展现出令人瞩目的性能甚至在GPU的领域内
在2019年的云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋向公众展示了他们的第一款AI芯片——含光800,这一亮相立即引起了巨大的关注。今年,在阿里的线上云栖活动中,异构计算产品研发总监龙欣继续分享了含光800近一年来的最新进展。
龙欣表示,含光800 NPU实例已经正式对外服务,不需要任何白名单限制,就可以在阿里云实例上购买。这种强大的AI处理器最多支持8核NPU和96核vCPU、384G内存以及网络带宽高达30Gbit/s,是专为数据中心的CNN类型模型推理加速而设计,应用场景包括城市大脑、图像视频审核以及拍立淘等。
更令人印象深刻的是,尽管含光800尚未对外发布,它在性能测试中的表现已经惊人地高出业界标准。在ResNet-50测试中,其推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,更是第二名的3.3倍。
为了让用户能够快速使用这款芯片,阿里云提供了一键安装NPU驱动和SDK,同时系统支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,并预装主流深度学习框架,如TensorFlow和MXNet。此外,还有示范教程帮助用户快速上手。
至于具体应用中的表现,一些数据显示,在行人检测应用中,4核含光800可支持100路视频,比主流GPU25路的推理性能提升4倍。在车辆检测中,与之类似,可支撑85路视频,比主流GPU10路推理性能提升8.5倍。而对于ResNet50 V2模型及Inception V4模型,其帧率分别达到20000 FPS及5000 FPS,比主流GPU提高11倍及10.8倍。此外,对于直播点播短视频增强,以及HDR点播,其FPS分别为500 FPS及66 FPS,也远超同级别硬件设备。
虽然这一系列数据表明了含光800在实际应用中的巨大优势,但此次分享并没有详细讨论其语言理解领域的具体情况。然而,这不应掩盖这一事实:即便具有如此强大的硬件能力,大规模落地仍需长时间投入,并且软件层面的成熟度也至关重要。如果你想了解更多关于未来如何利用这些先进技术来改善我们的生活,请继续关注雷锋网相关报道。