测评

Jurassic-X揭秘神经模型的符号推理之谜

在人工智能领域,AI21 Labs最近推出了名为Jurassic-X的算法系统,它基于该实验室提出的MRKL(模块化推理、知识和语言)系统。Jurassic-X是对标GPT-3的Jurassic-1的一个改进版本,克服了前者的不足,如不擅长推理、更新昂贵且不能有效处理时序数据等。

MRKL系统试图结合现有的神经网络模型、大规模语言模型LLM以及外部知识库,并与过去流行的符号专家系统相结合,以此来兼顾神经模型和符号推理能力。这种系统针对现有大规模语言模型的一些缺点进行了改进。在GPT-3及其他大规模语言模型进行预训练并应用于多个下游任务后,常常会出现两种极端的情况:零样本学习或微调整个模型,这两种方法都有其局限性。

为了解决这些问题,基于MRKL系统的Jurassic-X主要采用类似于prompt learning方式来冻结大部分原有参数,只更新相关任务参数,从而避免灾难性遗忘。此外,由于仅依赖神经语言模型也有其限制,如无法高效利用外部知识,尤其是在处理时序更新数据时,其推理能力较弱。

例如,对于问题“哪一家清洁能源公司在最近一个月里有最大的份额增长?”,需要从百科库WIKI接口获取清洁能源公司列表,再从日历中获取上个月日期,以及数据库中获取份额增长信息,然后通过计算器计算最大增长,最终由语言模型给出答案。这需要训练离散专家系统,将它们之间进行平滑连接,以及选择不同的模块技术细节可以参考介绍MRKL文章。

财富杂志分析显示,该技术反映了当代AI四个趋势:通用性、基于LLM、混合系统、减少权重训练。MRKL致力于使用单一模型解决各种自然语言任务,而不是像当前很多只解决特定单一任务,这是朝向通用人工智能必经之路。而GPT-3等大型LLM已经展示出在多个任务上的零样本学习潜力,大型预训练后的多任务共享也成为了研究界熟悉的范式,同时商业紧跟其后也是预料之中。

尽管基于神经网络的大规模性能令人印象深刻,但GPT-3在简单推理或涉及最新消息时仍然会犯错误。因此,使用代表当代AI商业角度下的第三个趋势——混合模式,即融合不同类型模块如深度学习和符号推理解决方案。这些模块包括直接从某些数据知识库检索信息以获得更新信息,还有一种路由(router)的设计,可以根据用户的问题匹配一个专家系统,比如数学则转向计算器,如果涉及汇率,则转到汇率转换器等等;如果路由对于问题不确定,则先通过一种称为“上下文”方式利用上下文来判断应该转向哪个专家模块。

最后,该论文还采用了一种叫做prompt tuning方式对于下游任务进行更新,这种方式避免了灾难性遗忘模式以及零样本学习低性能,同时还采用了一种递归式应用冻结LM机制,使得这个过程更加精细可控,有助于提升整体性能。此外,该技术还有许多实际应用场景,如智能助手电子商务等,都展现了它强大的实用价值。