行业动态

国产算力能源数据揭秘昆仑大模型升级密码

11月28日,由中国石油、中国移动、华为、科大讯飞共建的昆仑大模型又有突破:700亿参数昆仑大模型建设成果发布会在北京举办。继今年5月28日启动建设、8月28日发布330亿参数大模型阶段性成果后,昆仑大模型本次升级发布除尺寸参数大增外,还带来了43个石油行业的专业应用和通用应用创新场景。据悉,昆仑大模型已于今年8月23日通过了国家生成式人工智能服务备案,是中国能源化工行业首个通过备案的大模型。

中国石油集团党组成员、总会计师周松出席并致辞,国资委、国家数据局相关领导出席,中国移动党组成员、副总经理张冬,华为公司副总裁、油气矿山军团CEO韩硕,科大讯飞联合创始人、高级副总裁江涛致辞,共同发布建设成果。

“由人工智能引领的新一轮科技和产业变革方兴未艾,成为新旧动能转换、要素资源重组、竞争优势重构的关键力量。中国石油深入推进以昆仑大模型为核心的‘人工智能+’行动,加快实现人工智能赋能产业升级。”周松介绍,公司与三家头部企业强强联合,共同探索能源化工行业大模型建设与应用的有效路径,组建人工智能研究机构及工作专班,大力实施智能化发展工程,加快构建人工智能创新发展良好生态,全力打造务实高效、行业一 流的人工智能大模型和深度应用场景。

本次发布,昆仑大模型一系列能力均有重大跃升:在行业大模型方面,昆仑大模型语言大模型参数从330亿升级到700亿,自然语言处理、语音视觉识别、多模态交互、科学计算等专业能力大幅提升;视觉大模型训练数据进一步丰富,新增的岩石识别功能有效提升了地质研究智能化水平;新训练的160亿参数多模态大模型为“人·车·生活”等营销与服务业务提供了丰富的文、图、音多模态交互能力。在专业大模型方面,构建了国内首个勘探全领域专业大模型,涵盖地震处理、地震解释、测井处理解释3个专业大模型,相比传统方法,在泛化性、精度等方面都有了大幅提升。场景大模型方面,按需构建了21个场景大模型,每个场景大模型支持一类应用场景的多种应用。同时,昆仑大模型建立了场景数据集回流机制,将场景语料定期汇聚到专业、行业数据集,逐步提高专业、行业大模型能力,减少场景大模型数量。

在场外体验区和昆仑大模型关键能力演示环节,一系列智能化场景展现出昆仑大模型已经从“上新品”步入“上新品”与“强应用”有机结合新阶段。中国石油数字和信息化管理部总经理胡炳军介绍,昆仑大模型的创新应用场景呈现出业务领域覆盖更加广泛、业务结合更加紧密、“人工智能+”赋能效果更加显著等特点。专业应用场景覆盖范围从勘探延伸到炼化、销售、装备制造等领域,打造能源化工领域的智能“业务专家”;员工助手场景覆盖科研、办公等业务,开启了“AI+”高效办公新模式;行业大家应用助力从业者成为能源化工领域的“行家里手”;新增的智能油伴场景,以更“拟人”、更“聪明”的形象,为成品油、天然气广大消费者提供“贴心客服”。

此外,中国石油还构建了超过280TB的高质量数据集,研发了集团公司集中统一AI中台,算力、模型、应用的统一管理和协同调度能力有效加强;在实践探索中形成“1+4+N”大模型架构体系,提炼“三阶十步”的大模型项目建设方;启动中国石油人工智能创新应用大赛,大力营造人工智能创新氛围,积极培育人工智能文化,持续打造高水平人工智能队伍,加快提升人工智能场景创新能力。

科大讯飞联合创始人、高级副总裁江涛在发言中表示,自今年5月28日昆仑大模型建设任务启动以来,科大讯飞与中国移动、华为通力协作、密切配合,半年来形成了具有重要实践意义的大模型建设方,打造了高质量的能源化工行业数据集,真正走在了国内企业大模型建设工作最前列。

江涛表示,当前科大讯飞多语种技术支持85种语言,覆盖全球200多个国家和地区,有望进一步支持中国石油与海外尤其是“一带一路”沿线国家的高质量合作,加快建设“海外石油”的步伐。他还表示,科大讯飞期待与中国石油在AI for Science方面开展深度合作,联合培养一批人工智能复合型人才队伍,全面支撑“数智中国石油”建设。

今年10月24日科大讯飞发布的讯飞星火4.0 Turbo是基于全国首个国产万卡算力集群“飞星一号”训练的全民开放大模型,根据真实数据背靠背的测试,讯飞星火4.0 Turbo七项核心能力在中文领域全面超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o,同时,国产超大规模智算平台“飞星二号”也已正式启动。基于上述自主可控的技术优势,科大讯飞已成为多家央国企的大模型解决方案合作首选。媒体公开数据显示,2024年前三季度,科大讯飞在大模型市场的中标数量和金额均居行业第 一。至今,除中国石油外,科大讯飞已成为国家能源、中国海油、华润、华能、中国移动、中国绿发、中国钢研、中国信达、中国物流、中广核、中煤开发、中国烟草、厦门航空等多个重点行业头部企业的大模型合作伙伴。