热点资讯

美国禁华为芯片秘诀阿里含光800 AI巨无霸亮相在人脸识别自然语言处理和计算机视觉领域其性能竟然高出

2019年杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋在简短的介绍中推出了阿里的第一款AI芯片——含光800。这款当时最强大的AI推理芯片的发布不仅引发了巨大的关注,也可谓是高调亮相。

今年的线上云栖大会有一个关于芯片设计发展现状与未来的论坛。在这个论坛上,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买。这些实例支持8核NPU和96核vCPU、384G内存以及网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,其业务包括城市大脑、图像视频审核以及拍立淘等。”

更令人关注的是,含光800在具体应用中的表现。尽管它尚未对外发售,但其性能通过阿里云输出显示出其卓越之处。据雷锋网去年的报道所述,科技巨头自研芯片是因为有大量数据,在内部的AI需求推动下,以提升效率和性价比为目的。而龙欣也提到,在周五线上的分享中,Arivali巴巴内部有广阔的AI应用场景,这些应用包括电商平台、视觉识别系统、语音交互系统、自然语言理解系统及机器翻译等。

例如拍立淘,每天会新增10亿商品图片进行匹配,这要求极强的人工智能能力。因此,Arivali希望通过自研硬件方案来提升性价比。在硬件层面,它深度优化CNN及视觉类算法,加速卷积和矩阵乘操作,并针对ResNet-50等模型进行优化。此外,还具有高能效低延时、高密度计算与存储,以及软硬协同支持权重稀疏压缩和量化压缩指令集。

去年张建锋发布含光800时声称,“在业界标准ResNet-50测试中,其推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;而且能效比500 IPS/W,是第二名的3.3倍。”不过龙欣昨天没有提及具体峰值性能,而是强调了其可用性,即使作为并未公开市场销售的芯片,它通过Arivaili 云输出,可以让购买实例用户自动安装NPU驱动程序和SDK,并提供TensorFlow 和 MXNet示范教程。

至于实际应用情况,龍欣展示了三大场景中的性能提升:首先是在行人检测领域,其中4核心HPS 100路视频流,比主流GPU25路视频流多四倍;其次是在车辆检测领域,其中4核心HPS85路视频流,比主流GPU10路视频流多八点五倍;最后,在内容识别应用如直播短视频商品信息流中,对应ResNet50 V2模型,其帧率达到了20000 FPS,比主流GPU1800 FPS快11倍。

此外,在直播点播HDR质量增强方面,由於包含5個核心HPS可以達到500 FPS對比主線GPU50FPS,大幅提高速度達到10倍。但对于语音交互自然语言理解等领域,没有直接给出具体数字或案例说明。不过,从整体看,此次会议虽然没有给予特别关注但仍然展示了一些新的细节,同时也表明即便拥有如此强大的技术基础,要将这项技术落地还需时间并非易事。