测评

Jurassic-X揭秘神经模型的符号推理之谜

更新时间 2025年01月17日 2025年01月17日

在人工智能领域，AI21 Labs最近推出了名为Jurassic-X的算法系统，它基于该实验室提出的MRKL（模块化推理、知识和语言）系统。Jurassic-X是对标GPT-3的Jurassic-1的一个改进版本，克服了前者的不足，如不擅长推理、更新昂贵且不能有效处理时序数据等。

MRKL系统试图结合现有的神经网络模型、大规模语言模型LLM以及外部知识库，并与过去流行的符号专家系统相结合，以此来兼顾神经模型和符号推理能力。这种系统针对现有大规模语言模型的一些缺点进行了改进。在GPT-3及其他大规模语言模型进行预训练并应用于多个下游任务后，常常会出现两种极端的情况：零样本学习或微调整个模型，这两种方法都有其局限性。

为了解决这些问题，基于MRKL系统的Jurassic-X主要采用类似于prompt learning方式来冻结大部分原有参数，只更新相关任务参数，从而避免灾难性遗忘。此外，由于仅依赖神经语言模型也有其限制，如无法高效利用外部知识，尤其是在处理时序更新数据时，其推理能力较弱。

例如，对于问题“哪一家清洁能源公司在最近一个月里有最大的份额增长？”，需要从百科库WIKI接口获取清洁能源公司列表，再从日历中获取上个月日期，以及数据库中获取份额增长信息，然后通过计算器计算最大增长，最终由语言模型给出答案。这需要训练离散专家系统，将它们之间进行平滑连接，以及选择不同的模块技术细节可以参考介绍MRKL文章。

财富杂志分析显示，该技术反映了当代AI四个趋势：通用性、基于LLM、混合系统、减少权重训练。MRKL致力于使用单一模型解决各种自然语言任务，而不是像当前很多只解决特定单一任务，这是朝向通用人工智能必经之路。而GPT-3等大型LLM已经展示出在多个任务上的零样本学习潜力，大型预训练后的多任务共享也成为了研究界熟悉的范式，同时商业紧跟其后也是预料之中。

尽管基于神经网络的大规模性能令人印象深刻，但GPT-3在简单推理或涉及最新消息时仍然会犯错误。因此，使用代表当代AI商业角度下的第三个趋势——混合模式，即融合不同类型模块如深度学习和符号推理解决方案。这些模块包括直接从某些数据知识库检索信息以获得更新信息，还有一种路由（router）的设计，可以根据用户的问题匹配一个专家系统，比如数学则转向计算器，如果涉及汇率，则转到汇率转换器等等；如果路由对于问题不确定，则先通过一种称为“上下文”方式利用上下文来判断应该转向哪个专家模块。

最后，该论文还采用了一种叫做prompt tuning方式对于下游任务进行更新，这种方式避免了灾难性遗忘模式以及零样本学习低性能，同时还采用了一种递归式应用冻结LM机制，使得这个过程更加精细可控，有助于提升整体性能。此外，该技术还有许多实际应用场景，如智能助手电子商务等，都展现了它强大的实用价值。