彩电

阿里含光800 AI处理器亮相后在人物识别场景下性能高达4-11倍超越GPU是否算半导体芯片

在2019年的杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋简短介绍了阿里的首款AI芯片含光800,这次发布引发了巨大的关注。今年的线上云栖有一个芯片设计发展现状与未来的论坛,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。

他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,实例名称是ebman1.24xlarge,最多支持8核NPU和96核vCPU,384G内存,网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,业务包括城市大脑,大图像视频审核、拍立淘等。”更引人关注的是含光800在具体应用中的表现。

龙欣强调,含光800作为并没有在公开市场发售的芯片,但通过阿里云输出。为了让用户能开箱即用,他们可以自动安装NPU驱动和SDK,并且系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,还预装主流深度学习框架,如TensorFlow、MXNet示范教程。

目前,在三大AI应用中相比GPU,有4-11倍性能提升。在行人检测应用中,可支持100路视频,比主流GPU25路性能提升4倍;车辆检测可支持85路视频,比主流GPU10路性能提升8.5倍。在ResNet50 V2模型中,可达到20000 FPS,比主流推理GPU1800 FPS性能提升11倍;Inception V4模型中,可处理5000 FPS,比主流推理GPU460FPS性能加速比高10.8倍。此外,在直播、点播、短视频等视频质量增强中,可以实现10-6.6倍的性能加速比。

尽管今年对于含光800的关注度并不高,但其实际应用优势仍然值得关注。要将这款芯片大规模落地仍然需要很长时间,这个过程软件发挥着更加直接的作用,而获得客户认可和采用也并非易事。