热点资讯

阿里含光800 AI处理器高调亮相芯片封装工艺流程如同神兵利器在三大场景中展现出超凡脱俗的性能宛若猛

更新时间 2025年01月07日 2025年01月07日

在2019年的云栖大会上，阿里巴巴集团首席技术官兼阿里云智能总裁张建锋隆重发布了公司的首款AI芯片——含光800，这款当时最强大的AI推理芯片的问世，让整个行业震动。

一年后的今天，在一次线上论坛中，阿里云异构计算产品研发总监龙欣详细介绍了含光800推出的近一年的发展情况。据他透露，含光800 NPU实例已经正式对外服务，无需白名单即可在阿里云实例上购买，以ebman1.24xlarge命名，该实例支持最高8核NPU和96核vCPU、384G内存，以及30Gbit/s的网络带宽，主要面向数据中心的CNN类型模型推理加速，对于城市大脑、图像视频审核和拍立淘等业务提供强劲支持。

尽管含光800尚未对外发售，其性能却通过阿里云输出获得广泛关注。据介绍，此芯片设计有深度优化CNN及视觉类算法，加速卷积和矩阵乘，同时针对ResNet-50、SSD/DSSD、Faster-RCNN、Mask-RCNN、DeepLab等模型进行优化，并具备高能效、高密度计算与存储以及软硬协同支持权重稀疏压缩等特点。

龙欣还指出，由于未在公开市场发售，含光800直接通过阿里云输出，使得用户可以自动安装NPU驱动和SDK，并且系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04，还预装主流深度学习框架，如TensorFlow、MXNet。

至于其应用表现，此芯片在三大AI场景中的性能提升达到4-11倍，比如在城市大脑中使用40颗传统GPU处理视频延时300ms，而只需4颗含光800即可降至150ms；拍立淘商品库每天新增10亿商品图片识别时间由传统GPU需1小时缩减至5分钟；行人检测应用中，可同时处理100路视频，而主流GPU仅25路；车辆检测则为85路视频，比主流GPU10路多8.5倍。此外，在直播内容识别应用中的ResNet50 V2模型帧率可达20000 FPS，比主流推理GPU1800 FPS提升11倍；而点播HDR则实现6.6倍性能加速比。