半导体革命含光800 AI处理器闪耀登场三大应用场景性能超越GPU4-11倍
2019年杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋在简短的介绍中推出了阿里的第一款AI芯片——含光800。这款当时最强的AI推理芯片的发布不仅引发了巨大的关注,也可以说是高调亮相。今年,在阿里线上云栖举行的一个芯片设计发展现状与未来的论坛,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。
他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,实例名称是ebman1.24xlarge,最多支持8核NPU和96核vCPU,384G内存,网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,业务包括城市大脑、图像视频审核、拍立淘等。”更令人关注的是含光800在具体应用中的表现。
据雷锋网去年的文章所述,科技巨头自研芯片,是因为有大量数据,在内部的AI需求推动下,以提升效率和性价比为目的。周五线上分享中,龙欣也表明了这一点,他指出,即便没有公开销售,但通过阿里云输出,这样做就是为了让购买实例用户能够自动安装NPU驱动和SDK,并且系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,还预装主流深度学习框架,如TensorFlow、MXNet,以及提供示范教程。
龙欣强调,由于其硬件特点,它适用于数据中心以及大型端上的CNN类模型加速,并可扩展到其他DNN模型中。在三大AI应用场景中,其性能比GPU提升4-11倍。例如,在城市大脑中使用传统GPU需要40颗处理器,而使用含光800仅需4颗;拍立淘商品库每天新增10亿商品图片,用传统GPU识别需要1小时,而用含光800缩减至5分钟;而在行人检测应用中,它能支持100路视频,比主流GPU25路性能提升4倍;车辆检测则能支持85路视频,比主流GPU10路性能提升8.5倍。
此外,对于ResNet50 V2模型中的内容识别应用,其帧率可达20000 FPS,比主流推理GPU1800 FPS性能提升11倍;对于Inception V4模型,其处理帧率达到5000 FPS,比主流推理GPU460FPS性能加速比高10.8倍。此外,在直播、点播HDR等视频质量增强领域,其优势同样显著。
尽管如此,由于目前紧张的贸易关系,让所有相关话题更加谨慎,因此今年关于含光800的话题并没有去年那么高热度。不过,从软件层面的角度来看,无论如何,都要通过实际落地验证其潜力,这是一个长期而艰难的过程。而对于未来可能会出现的一代又一代新型AI芯片,我们只能期待它们能够进一步突破技术边界,为各行业带来更多创新成果。