3nm芯片量产日等待阿里含光800 AI处理器闪耀亮相三大场景体验性能爆发GPU比拼无果
2019年杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋隆重介绍了阿里的首款AI芯片含光800,这款在业界最强的AI推理芯片发布之际,不仅震惊了科技界,也引发了广泛的关注。今年,在最新一届线上云栖大会中,阿里云异构计算产品研发总监龙欣再次带来了一场关于含光800设计发展现状与未来的盛会。
在这次会议上,龙欣详细阐述了近一年来含光800的最新进展。他指出,含光800 NPU实例已经正式对外服务,无需白名单即可在阿里云实例上购买。这意味着用户可以轻松获取到这一高性能的AI处理器,以满足日益增长的数据中心需求。具体来说,这款芯片支持8核NPU和96核vCPU、384G内存,以及网络带宽最高达到30Gbit/s,是针对CNN类型模型推理加速而设计,适用于城市大脑、图像视频审核以及拍立淘等业务场景。
更值得注意的是,尽管含光800尚未对外发售,其性能通过阿里云输出已显现出其卓越能力。在去年的文章中,我们提到过科技巨头自研芯片是为了满足内部庞大的AI需求,以提升效率和性价比。而今,在昨天的分享中,龙欣进一步阐释了这一点,他提到了包括电商应用、视觉应用、语音交互、自然语言理解等众多领域,其中拍立淘作为一个典型案例,其需要极强的大规模图片搜索和个性化推荐功能,因此对于高性能AI处理器有着迫切需求。
据悉,包含深度优化CNN及视觉类算法、高能效低延时、高密度计算与存储以及软硬协同支持权重稀疏压缩等多项特色,使得含光800不仅能够提供极佳的推理速度,还能保持一定程度上的灵活性,以适应未来新型激活函数和算法。至于具体数字方面,比如ResNet-50测试中的78563 IPS(每秒钟识别次数)远超当前行业标准,而能效比500 IPS/W则是第二名3.3倍之多。
不过,对于实际应用中的表现,一直是所有人关注的话题。在昨天分享中,没有直接披露峰值性能,但强调其可用性,并且展示了三大场景中的4-11倍性能提升:城市大脑从40颗传统GPU降至4颗;拍立淘商品库由1小时缩短至5分钟;行人检测增至100路视频,比主流GPU25路提升4倍;车辆检测85路视频,比10路提升8.5倍。此外,在直播内容识别与HDR质量增强等领域也显示出了显著优势。
尽管此次分享相较去年略显简洁,而且由于当前贸易环境可能导致话题更加谨慎,但更为重要的是,即便拥有如此先进设备,大规模落地仍然是一个长期过程,而软件成为了关键环节。此外,由于涉及到大量客户认可和采用问题,所以虽然团队能够迅速设计出一款芯片,但要实现真正意义上的普及依旧面临挑战。因此,可以预见,只要不断迭代创新,最终将取得成功。不过,对于下一代AI芯片何时问世,则还需要继续观察并期待更多更新信息。