312条智能轨迹助力241%性能跃升,上交大与SII携手打造开源电脑智能体引领科技新趋势

在电脑智能体(Computer Use Agent)领域,最近有一个激动人心的进展。上海交通大学与 SII 的研究团队,借助仅312条人类标注的操作轨迹,成功训练出了名为 PC Agent-E 的新一代开源电脑智能体,其性能提升高达241%,超越了著名的 Claude3.7Sonnet,成为 Windows 系统上的新一代最优模型。

自从 Anthropic 推出 Claude Computer Use 以来,电脑智能体的发展一直备受关注。OpenAI 也相继发布了 Operator,通过强化学习技术提升电脑智能体的能力。然而,业界普遍认为,要想达到这样的水平,需要大量的轨迹数据和复杂的强化学习算法。面对这种观点,上海交通大学和 SII 的团队用实际成果反驳了这一说法:只需少量的高质量数据,便能激发智能体的潜力。

image.png

这项研究的关键在于如何有效利用人类的操作轨迹。研究团队仅用了两名研究者一天的时间,通过开发的工具 PC Tracker,收集到了312条真实的操作轨迹。这些轨迹包含任务描述、屏幕截图以及详细的键盘和鼠标操作记录,确保了数据的准确性。在这之后,研究团队还为这些轨迹进行了 “思维链补全”,即为每个动作提供了背后的思考过程,使得数据更加完整。

为了进一步提升模型的性能,团队引入了 “轨迹增强” 技术。通过使用 Claude3.7Sonnet,研究人员为每一步的操作合成了多个合理的动作决策,这样不仅增加了轨迹数据的多样性,也显著提高了训练的效率。最终,PC Agent-E 在 WindowsAgentArena-V2的测试中表现出色,超越了 Claude3.7Sonnet 的 “extended thinking” 模式。

image.png

这项研究的成果显示,使用少量高质量的数据即可实现强大的智能体训练,不再需要海量的标注数据。这为未来更智能的数字代理的发展指明了方向,团队也认为,通过提高轨迹数据的质量,可以有效降低数据需求,推动智能体的自主性提升。

论文地址:https://arxiv.org/abs/2505.13909

代码地址:https://github.com/GAIR-NLP/PC-Agent-E

模型地址:https://huggingface.co/henryhe0123/PC-Agent-E

数据地址:https://huggingface.co/datasets/henryhe0123/PC-Agent-E

猜你喜欢

金铲铲之战神将羁绊效果解析及神将羁绊机制详解
金铲铲之战神将羁绊效果解析及神将羁绊机制详解

在金铲铲之战中有不少的羁绊,每个棋子都可以搭配不同的羁绊,每个羁绊的效果也是不同的,今天小编就来分享下神将羁绊效果,感

哈利波特魔法觉醒抽卡位置介绍以及各类卡片的抽卡概率分析
哈利波特魔法觉醒抽卡位置介绍以及各类卡片的抽卡概率分析

在哈利波特魔法觉醒中抽卡是很重要的,玩家可以通过抽卡来获取新的卡牌,是玩家获取卡牌的主要途径,那么在游戏中抽卡该怎么玩

暗黑破坏神4S4野蛮人机动回火装备锻造与属性优化全面指南
暗黑破坏神4S4野蛮人机动回火装备锻造与属性优化全面指南

暗黑破坏神4S4野蛮人机动回火装备锻造攻略

豪杰成长计划中纳妾的具体条件是什么 怎么进行后院的建设与规划
豪杰成长计划中纳妾的具体条件是什么 怎么进行后院的建设与规划

在豪杰成长计划中有各种各样的玩法,纳妾就是其中之一,没错,玩家可以在游戏中纳妾,还是很有趣的,下面就跟着小编来看看纳妾

哈利波特魔法觉醒无限啃大瓜玩法详解 无限啃大瓜卡组最佳搭配推荐与攻略
哈利波特魔法觉醒无限啃大瓜玩法详解 无限啃大瓜卡组最佳搭配推荐与攻略

在哈利波特魔法觉醒中有很多的卡组,这些卡组玩法都有不同的技巧,而且还由不同的卡牌搭配而成,无限啃大瓜就是一个热门的流派

风暴之城荒野循环成就解锁的完整流程与详细指导手册
风暴之城荒野循环成就解锁的完整流程与详细指导手册

风暴之城荒野之循环成就解锁全流程指南

暖暖的换装物语全S通关技巧与省钱指南,轻松攻略暖暖的换装物互动!
暖暖的换装物语全S通关技巧与省钱指南,轻松攻略暖暖的换装物互动!

《暖暖换装物语》是一款女孩子非常喜欢的手游换装游戏。游戏中有很多时尚漂亮风格各异的衣服,玩家的暖暖换装物语任务就是根据游

王者荣耀魔女回忆副本通关技巧分享及阵容搭配推荐攻略
王者荣耀魔女回忆副本通关技巧分享及阵容搭配推荐攻略

在王者荣耀中赚钱方法很多,但是想快速赚钱,最简单的办法还是刷副本魔女回忆了,因为魔女回忆副本通关后有很多的奖励。那么王者