月之暗面正式推出自研智能体 Kimi-Researcher 实现科技新突破

月之暗面(Moonshot AI)今日推出其备受期待的 Kimi 研究功能,正式加入日益激烈的 AI 智能体(Agent)竞争。据称,该功能在多项基准测试中表现出色,尤其在名为“人类终极考验”(Humanity's Last Exam,HLE)的测试中,其性能超越了谷歌和 OpenAI 的同类产品,一举登顶。

QQ20250623-103851.png

Kimi-Researcher:强大的多轮搜索与推理智能体

Kimi 研究功能的核心是 Kimi-Researcher,这是一款擅长多轮搜索与推理的自主智能体。根据官方数据,在执行每个任务时,Kimi-Researcher 平均会进行23个推理步骤,并浏览 超过200个网址,展现出强大的信息处理和分析能力。

基准测试表现:HLE 登顶,RL 训练效果显著

Kimi-Researcher 基于 Kimi k-系列模型的内部版本构建,并完全通过 端到端的智能体强化学习(RL) 进行训练。在“人类终极考验”(HLE)这项测试中,它取得了26.9% 的 Pass@1得分率,达到了业界顶尖水平;其 Pass@4准确率更是高达40.17%。

值得注意的是,Kimi-Researcher 的 HLE 初始得分仅为8.6%,最终能达到26.9% 的高分,几乎完全得益于端到端的强化学习训练。月之暗面表示,这有力地证明了端到端智能体强化学习可以极大地推动智能体智能水平的提升。

此外,Kimi-Researcher 在多个复杂且具挑战性的真实世界基准测试中也表现出色。例如,在 xbench 测试(一套全新的、动态的、与专业需求对齐的测试套件)的 xbench-DeepSearch 项目上,Kimi-Researcher 取得了69% 的 Pass@1(4次运行平均值),其表现优于配备了搜索工具的 o3等模型。在针对多轮搜索推理(如 FRAMES、Seal-0)和事实性信息问答(如 SimpleQA)的基准测试中,Kimi-Researcher 同样表现出色。

QQ20250623-104025.png

开源计划与内测申请

月之暗面宣布,Kimi-Researcher 将于今日起逐步向用户开放,现在用户可以访问 kimi.com 申请内测。更令人振奋的是,未来几个月内,月之暗面将 开源 Kimi-Researcher 背后的基础预训练模型以及经过强化学习训练后的模型,这将为 AI 社区的发展带来重要贡献。

GitHub:https://moonshotai.github.io/Kimi-Researcher/

猜你喜欢

方舟生存进化静心膏的具体使用方法与获取途径详解
方舟生存进化静心膏的具体使用方法与获取途径详解

方舟生存进化静心膏是游戏中比较重要的稀有道具,获取难度很高,方舟生存进化静心膏怎么使用?方舟生存进化静心膏怎么获得?91

如何在拖拉机游戏中帮助庄家获胜?掌握拖拉机坐庄技巧赢得更多胜利
如何在拖拉机游戏中帮助庄家获胜?掌握拖拉机坐庄技巧赢得更多胜利

拖拉机又称升级游戏,是很讲究技术的扑克游戏,拖拉机坐庄怎么赢?拖拉机怎么帮庄家赢?一起来和91单机小编来看看吧。拖拉机也

掼蛋中可以打出的各种牌型有哪些?顺子究竟可以出多少张牌呢?
掼蛋中可以打出的各种牌型有哪些?顺子究竟可以出多少张牌呢?

掼蛋是近年来新流行起来的打法,掼蛋有哪些牌型可以出?掼蛋顺子最多出几张?一起来和91单机小编来看看吧。这款游戏有许多的规

装甲核心6系统工程师全解锁流程图文详解及实践指南
装甲核心6系统工程师全解锁流程图文详解及实践指南

装甲核心6系统工程师解锁全流程图文解析

侠客风云传中侠客天堂的具体功能及其在游戏中的重要作用解析
侠客风云传中侠客天堂的具体功能及其在游戏中的重要作用解析

很多小伙伴不知道侠客风云传侠客天堂有什么用?很多玩家并不清楚侠客天堂到底有怎样的用处,要如何获取,那么侠客风云传侠客天堂

神之天平探索地图补丁肩甲获取路线详细解析及攻略分享
神之天平探索地图补丁肩甲获取路线详细解析及攻略分享

神之天平探索地图获取补丁肩甲路线图

《第七史诗》快速升级的方法及前期经验获取攻略详解
《第七史诗》快速升级的方法及前期经验获取攻略详解

第七史诗中等级限制了很多玩法,第七史诗怎么快速升级?第七史诗前期经验怎么获得?一起来和91单机小编来看看吧。第七史诗快速

崩坏学园2公主祈愿活动详细攻略及公主之辉光获取方法解析
崩坏学园2公主祈愿活动详细攻略及公主之辉光获取方法解析

崩坏学园2公主祈愿活动能够获得很不错的装备,崩坏学园2公主祈愿活动怎么玩?崩坏学园2公主之辉光怎么获得?一起来和91单机