前谷歌 CEO 旗下初创公司推出240亿参数的化学推理模型,精度超越多个行业领先对手

在人工智能领域,大模型的研究不断进展,尤其是在推理能力的提升上。最近,由前谷歌 CEO 埃里克・施密特投资的初创公司 FutureHouse,开源了一个名为 ether0的化学任务推理模型,参数规模高达240亿。这一模型在不需要额外领域预训练的情况下,通过后训练技术,展现出强大的化学领域能力,尤其是在数据需求上相比于传统领域专用模型显著减少。

推理模型的应用不仅限于简单的选择题测试,FutureHouse 团队希望通过 ether0改变这种现状,推动科学推理的深入研究。为了构建该模型,研究团队从大量的学术论文中整理了化学实验数据,追踪分子特性如溶解度和气味,并将这些数据转化为可验证的科学问题。

image.png

ether0基于 Mistral-Small-24B 架构,利用强化学习进行训练,并处理了640,730个实验数据相关的化学问题,涵盖18类任务,包括合成可行性、血脑屏障渗透性和气味分析等。为了提升模型性能,研究团队引入了推理行为蒸馏和动态课程学习等技术。

在性能评估方面,ether0与多种通用大语言模型(如 Claude、o1)及化学专用模型(如 ChemDFM、TxGemma)进行了对比。结果显示,ether0在开放答案(OA)类别中准确率最高,选择题(MCQ)方面也具备强大的竞争力。其在某些任务上的准确率甚至达到了竞争对手的两倍以上。

此外,ether0在训练成本上也展现出显著的优势,要达到相似的反应预测准确率,传统的非推理型模型需要消耗50倍以上的数据。尽管 ether0在独立基准测试中难以与其他模型及人类表现进行交叉验证,但其能够对未经过训练的分子结构进行有效推理。

总之,ether0不仅能理解自然语言提问,还能通过自然语言进行推理,最终生成分子结构,特别擅长于类药分子的设计。尽管目前仍处于原型阶段,但其已为未来构建通用科学推理模型奠定了坚实的基础。

划重点:  

🌟 Ether0是由 FutureHouse 开源的240亿参数化学推理模型。  

📈 该模型的准确率在多个任务中超越了 GPT-4.1和 DeepSeek-R1等领先模型。  

💰 训练 ether0所需的数据量显著低于传统非推理型模型。

猜你喜欢

在EVE星战前夜手游中如何有效对抗天使与恶魔势力,获得胜利的方法和策略
在EVE星战前夜手游中如何有效对抗天使与恶魔势力,获得胜利的方法和策略

EVE星战前夜手游天使还是恶魔怎么打?过关流程是什么?来看看91小编带来的EVE星战前夜手游天使还是恶魔攻略。天使还是恶

腐烂国度2永恒守卫中无尽怒火技能的伤害数值详细解析及实战应用
腐烂国度2永恒守卫中无尽怒火技能的伤害数值详细解析及实战应用

腐烂国度2永恒守卫之无尽怒火伤害数值解析

最强蜗牛封印石的使用攻略与技巧解析,教你如何充分发挥其潜力
最强蜗牛封印石的使用攻略与技巧解析,教你如何充分发挥其潜力

最强蜗牛封印石怎么玩好呢?下面小编为大家带来最强蜗牛封印石玩法技巧,一起看看吧 封印石封印石展示贵重品需求五维属性为:人

猎人荒野的呼唤中雷文图里稀有鹊鸭的刷新机制详解与捕捉技巧
猎人荒野的呼唤中雷文图里稀有鹊鸭的刷新机制详解与捕捉技巧

猎人荒野的呼唤雷文图里稀有鹊鸭刷新机制

魔渊之刃斧头法盘最佳搭配攻略,如何选择搭配以提升角色战斗力
魔渊之刃斧头法盘最佳搭配攻略,如何选择搭配以提升角色战斗力

魔渊之刃斧头法盘怎么玩?接下来看看91小编给大家带来的魔渊之刃斧头法盘搭配技巧吧!斧头法盘:这个盘能够 转一下是跑图专用

咒术力量:针对埃欧大陆投射物抗性装备搭配的全面推荐指南
咒术力量:针对埃欧大陆投射物抗性装备搭配的全面推荐指南

咒术力量:征服埃欧大陆投射物抗性装备搭配推荐

猎魂觉醒塞亚角色分析及注灵机制详解,带你了解塞亚的强大与魅力
猎魂觉醒塞亚角色分析及注灵机制详解,带你了解塞亚的强大与魅力

猎魂觉醒在近日迎来了更新,受到很多玩家的关注,其中还为叛逆之子塞亚带来了他的注灵更新,那么下面就一起来看下猎魂觉醒叛逆之

小小法师新手入门指南 提升通关效率的实用技巧和战略
小小法师新手入门指南 提升通关效率的实用技巧和战略

小小法师新手怎么玩,在这个关键时刻,我们要把握优势,这篇文章带你飞,在开局的阶段要做些什么会比较的好,如何能够快速的通关

阴阳师手游2021年弈御魂选择指南,最佳搭配和策略解析
阴阳师手游2021年弈御魂选择指南,最佳搭配和策略解析

在阴阳师手游中有很多的式神,弈是小编非常喜欢的一位式神,这位式神技能属性非常不错,还是挺值得培养的,下面就跟着小编一起来