热点资讯

华为芯片突破含光800 AI处理器在人物场景中的应用性能超越GPU高达4-11倍

在2023年的阿里云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建峰再次推出了公司的自研AI芯片——含光800。尽管这款芯片已经在去年发布,但它依然引起了广泛关注,因为它不仅代表着中国在AI领域的技术突破,而且其高性能和能效比也为行业内外的科技巨头们所瞩目。

今年,龙欣作为阿里云异构计算产品研发总监,在一次线上论坛中分享了近一年来的最新进展。他指出,含光800 NPU实例现在已经正式对外服务,不需要白名单即可购买,并且提供了具体配置信息,如支持8核NPU、96核vCPU、384G内存和30Gbit/s网络带宽。这些特性使得含光800成为处理数据中心中的CNN类型模型推理加速工作量时的一流选择,无论是城市大脑、图像视频审核还是拍立淘等应用场景。

更值得一提的是,尽管含光800还未对外发售,它的性能表现却令人印象深刻。在一些典型应用中,比如拍立淘这样的电商平台,它能够极大地提升搜索速度和个性化推荐能力。这对于一个拥有两千多万日活用户的大型图片搜索平台来说,无疑是一个巨大的优势。

除了硬件优化方面,龙欣还强调了软件与硬件协同工作的重要性。例如,对于ResNet-50、SSD/DSSD、Faster-RCNN、Mask-RCNN等模型进行了针对性的优化,以及支持权重稀疏压缩和向量计算,这些都是为了实现更高效率、高性能的目标。

据统计,在行人检测应用中,4核含光800可以支撑100路视频,比主流GPU多4倍;车辆检测则提升到了85路视频,比主流GPU增加8.5倍。在ResNet50 V2模型下,其帧率可达20000 FPS,比主流GPU提高11倍;而Inception V4模型,则达到5000 FPS,与主流GPU相比提升10.8倍。此外,在直播视频增强功能上,它可以处理500 FPS,而点播HDR则有66 FPS,使得它在这些场景中的性能加速比均超过10倍。

尽管这一系列数据展示了一定程度上的潜力,但我们仍需观察后续如何落地并扩展到更多实际应用中。不过,从目前来看,一旦成功,将会是一项具有重大影响力的技术突破,为相关行业带来革命性的变化。