阿里通义实验室推出全新ZeroSearch功能:实现大模型自主“搜索”,无需依赖API

在人工智能的迅速发展中,如何提升大语言模型(LLM)的检索和推理能力成为研究的热门话题。近日,阿里通义实验室提出了一个名为 “ZeroSearch” 的新框架,它能够使大型语言模型自己模拟搜索引擎,从而在没有实际搜索引擎的情况下,提升其推理能力。

传统的搜索引擎虽然强大,但在训练大模型时,它们的输出质量常常不可预测,可能导致训练过程中的噪声和不稳定。此外,依赖真实搜索引擎的 API 调用会产生巨大的成本,这让大规模的强化学习训练变得不切实际。而 ZeroSearch 的出现,恰好解决了这些问题。这个框架通过模拟搜索环境和渐进式抗噪训练,允许大模型在无需与真实搜索引擎交互的情况下进行学习。

通义 Qwen (4)

ZeroSearch 的核心是利用强化学习(RL)和少量的标注数据对大模型进行微调,使其能够生成有用的文档和干扰文档。在训练过程中,模型会学习如何生成与真实搜索引擎风格相似的内容,同时适应不同质量文档的生成。这种动态调整的能力让模型在面对更复杂的检索任务时,能够迅速适应并找到平衡。

此外,ZeroSearch 采用了课程式学习的方法。在训练初期,模型会接收到高质量的文档,而随着训练的深入,模型将逐步接触到混入噪声的文档。这种逐步提升难度的策略,不仅提升了模型的推理能力,还增强了训练的稳定性和效果。经过训练,模型能够在高质量和低质量文档中找到最佳的检索策略。

研究表明,ZeroSearch 在多个问答数据集上表现优异,尤其在单跳和多跳问答任务中,相较于传统方法,它的表现有明显优势。这意味着 ZeroSearch 不仅在简单问题上能提供准确答案,还能够应对更复杂的查询任务。

ZeroSearch 为大模型的自我学习提供了全新的思路,消除了与搜索引擎之间的依赖,使得大规模的强化学习训练更加经济可行。未来,ZeroSearch 有望在提升 LLM 的检索能力和应用范围方面发挥更大作用。

猜你喜欢

问道手游精怪精获取攻略详解,助你轻松掌握精怪精获得方法
问道手游精怪精获取攻略详解,助你轻松掌握精怪精获得方法

好多玩问道手游的玩家不知道里面的精怪有什么作用。也不太清楚游戏里面的精怪要怎么才能够得到,所以非常的着急。所以今天小编就

不思议迷宫英雄之村快速获取佐罗碎片的最佳组合与通关攻略分享
不思议迷宫英雄之村快速获取佐罗碎片的最佳组合与通关攻略分享

不思议迷宫佐罗可是后期冲高层的必备平民冈布奥,佐罗冈布奥的碎片需要通关英雄之村获得,那么英雄之村速刷阵容怎么搭配,如何速

刺客信条幻景杜尔库里加尔祖隐藏入口解锁详细攻略与技巧分享
刺客信条幻景杜尔库里加尔祖隐藏入口解锁详细攻略与技巧分享

刺客信条幻景杜尔库里加尔祖隐藏入口解锁攻略

在狼人杀游戏中平民如何巧妙伪装为炸弹师,详细玩法和策略攻略分享
在狼人杀游戏中平民如何巧妙伪装为炸弹师,详细玩法和策略攻略分享

狼人杀最近更新了一个新的人物炸弹师,那么狼人杀平民怎么伪装成炸弹师?小编给大家来介绍狼人杀平民伪装成炸弹师玩法攻略,欢迎

王者荣耀抽奖规则揭晓 钻石夺宝和点券夺宝概率详细分析与揭秘
王者荣耀抽奖规则揭晓 钻石夺宝和点券夺宝概率详细分析与揭秘

王者荣誉终于公布了各项玩法概率,其中就有玩家最关心的钻石夺宝和点券夺宝的抽奖概率,下面就和91一起来看看王者荣耀抽奖概率

命运2年6第21赛季冰冷安慰快速刷取方法与技巧分享
命运2年6第21赛季冰冷安慰快速刷取方法与技巧分享

命运2年6第21赛季冰冷安慰速刷技巧分享

王者荣耀武道大会最佳阵容推荐与攻防结合的全面解析
王者荣耀武道大会最佳阵容推荐与攻防结合的全面解析

王者荣耀武道大会阵容推荐 攻防兼备阵容解析,很多玩家都喜欢玩武道大会,那么武道大会的英雄阵容应该怎么搭配呢?今天小编就为

模拟农场25高效利润提升技巧:优质农作物推荐与种植策略
模拟农场25高效利润提升技巧:优质农作物推荐与种植策略

模拟农场25高效赚钱指南:精选农作物推荐

碧蓝航线初始角色选择攻略推荐 三大最优角色解析与选择建议
碧蓝航线初始角色选择攻略推荐 三大最优角色解析与选择建议

碧蓝航线初始角色选哪个好,三大初始角色选择推荐,碧蓝航线4月18日开启二次测试,很多新手玩家进入游戏就会面临选择初始角色