热点资讯

阿里含光800 AI处理器高调亮相芯片封装工艺流程如同神兵利器在三大场景中展现出超凡脱俗的性能宛若猛

在2019年的云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋隆重发布了公司的首款AI芯片——含光800,这款当时最强大的AI推理芯片的问世,让整个行业震动。

一年后的今天,在一次线上论坛中,阿里云异构计算产品研发总监龙欣详细介绍了含光800推出的近一年的发展情况。据他透露,含光800 NPU实例已经正式对外服务,无需白名单即可在阿里云实例上购买,以ebman1.24xlarge命名,该实例支持最高8核NPU和96核vCPU、384G内存,以及30Gbit/s的网络带宽,主要面向数据中心的CNN类型模型推理加速,对于城市大脑、图像视频审核和拍立淘等业务提供强劲支持。

尽管含光800尚未对外发售,其性能却通过阿里云输出获得广泛关注。据介绍,此芯片设计有深度优化CNN及视觉类算法,加速卷积和矩阵乘,同时针对ResNet-50、SSD/DSSD、Faster-RCNN、Mask-RCNN、DeepLab等模型进行优化,并具备高能效、高密度计算与存储以及软硬协同支持权重稀疏压缩等特点。

龙欣还指出,由于未在公开市场发售,含光800直接通过阿里云输出,使得用户可以自动安装NPU驱动和SDK,并且系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,还预装主流深度学习框架,如TensorFlow、MXNet。

至于其应用表现,此芯片在三大AI场景中的性能提升达到4-11倍,比如在城市大脑中使用40颗传统GPU处理视频延时300ms,而只需4颗含光800即可降至150ms;拍立淘商品库每天新增10亿商品图片识别时间由传统GPU需1小时缩减至5分钟;行人检测应用中,可同时处理100路视频,而主流GPU仅25路;车辆检测则为85路视频,比主流GPU10路多8.5倍。此外,在直播内容识别应用中的ResNet50 V2模型帧率可达20000 FPS,比主流推理GPU1800 FPS提升11倍;而点播HDR则实现6.6倍性能加速比。

尽管今年涉及此主题的话题不再引人瞩目的热潮,但我们应当看到,即便拥有强大的团队设计出先进芯片,大规模落地仍然需要长时间努力。在这个过程中软件扮演着更为关键的角色,它是客户认可并采用新技术所必经之途。对于未来是否会有新的版本或更新,我们只能期待雷锋网将继续关注并报道最新消息。