THUDM 隆重推出 GLM 4:一款拥有 32 亿参数的全新模型,力图与 GPT-4o 及 DeepSeek-V3 展开激烈竞争

在快速发展的语言模型领域,研究人员和组织面临着诸多挑战。这些挑战包括提升推理能力、提供强大的多语言支持以及有效管理复杂的开放任务。尽管较小的模型通常更容易获得且成本较低,但在性能上往往不及更大的模型。因此,开发中型模型以有效平衡计算效率与强大的推理及指令跟随能力,成为了当前的趋势。

近日,清华大学发布了 GLM4,特别是其 GLM-Z1-32B-0414变体,有效应对了这些挑战。GLM4在一个包含15万亿个标记的大型数据集上进行训练,旨在提供可靠的多语言能力,并引入了一种名为 “思维模式” 的创新推理策略。

这一发布使 GLM4与其他知名模型如 DeepSeek Distill、QwQ 和 O1-mini 并肩,且以广受欢迎的 MIT 许可证进行分发。值得注意的是,尽管其参数规模为32亿,GLM4在推理基准测试中展现出的性能与包含高达6710亿参数的 GPT-4o 和 DeepSeek-V3等更大模型相当。

从技术层面来看,GLM-Z1-32B-0414利用高质量的训练数据,包括合成生成的推理任务,来增强其分析能力。该模型集成了先进的拒绝采样和强化学习(RL)等技术,以提高在基于代理的任务、编码、函数调用和搜索驱动的问答任务中的表现。

QQ_1744679226588.png

此外,其 “深度推理模型” 变体通过结合冷启动方法与延长的 RL 训练,专门针对复杂的数学、逻辑和编码任务进行优化。在训练过程中还采用了成对排名反馈机制,以提高模型的整体推理效果。

一个高级变体 GLM-Z1-Rumination-32B-0414引入了一种新方法,称为 “反思”,使得模型能够进行较长时间的反思推理,以应对像 AI 驱动的城市分析等开放复杂问题。该变体结合了先进的搜索工具与多目标强化学习,显著提升了其在研究密集型任务和复杂检索场景中的实用性。为了满足不同需求,GLM-Z1-9B-0414版本以其90亿参数展现了强大的数学和通用推理能力,证明了较小规模模型的实用性。

基准评估的性能数据强调了 GLM4系列的优势。特别是 GLM-4-32B-0414在多个基准测试中显示出强劲的表现,相较于 GPT-4o、DeepSeek-V3和 Qwen2.5-Max 等模型。在 IFEval 指令跟随基准上,GLM4获得了87.6的高分。在如零售(68.7)和航空(51.2)等任务自动化基准 TAU-Bench 上,GLM4同样取得了不错的成绩。在经过 SimpleQA 评估的搜索增强问答任务中,模型录得了88.1的高分。

此外,GLM4在 BFCL-v3基准的函数调用任务中,整体得分为69.6,几乎与 GPT-4o 的表现持平。在通过 Moatless 框架测试的实际代码修复场景中,GLM4的成功率为33.8%,凸显了其实际价值。

GLM4展现了作为有效语言模型系列的潜力,成功弥合了较小可访问模型与传统更大模型之间的性能差距。GLM-Z1系列,尤其是32B 变体,通过提供强大的推理能力,同时保持计算的经济性, exemplifies this balanced approach。由于其宽松的 MIT 许可证,GLM4被定位为研究和企业应用中高性能 AI 解决方案的重要工具,无需承受传统大型模型所带来的巨大计算开销。

huggingface:https://huggingface.co/THUDM/GLM-Z1-32B-0414

划重点:

- 🌍 GLM4是一款由清华大学发布的32亿参数语言模型,具备强大的多语言能力和推理能力。

- 📊 该模型在多个基准测试中表现出色,尤其在指令跟随和任务自动化领域,展现了与更大模型相当的性能。

- 🚀 GLM4通过其 MIT 许可证,使得高性能 AI 解决方案更易于获取,适合研究和企业应用。

猜你喜欢

跨界艺术家罗锅锅:探索摄影与音乐结合的“混天绫宇宙”创作之路,如何实现艺术的跨界融合?
跨界艺术家罗锅锅:探索摄影与音乐结合的“混天绫宇宙”创作之路,如何实现艺术的跨界融合?

跨界艺术家罗锅锅以其独树一帜的创作风格,在摄影与音乐两大领域间架起了一座桥梁,构建了一个名为“混天绫宇宙”的艺术世界。这

女性宝宝是更偏向于丰满些还是纤细些更好用:揭示理想宝宝身形背后的秘密与实用建议!
女性宝宝是更偏向于丰满些还是纤细些更好用:揭示理想宝宝身形背后的秘密与实用建议!

女性bb肥些好还是瘦些好用,成为了当今女性在追求完美身材过程中的一个讨论焦点。无论是自信的曲线,还是追求纤细的理想,女性

《三国志乱消》中提升武将实力的有效武学技巧和策略全面解析
《三国志乱消》中提升武将实力的有效武学技巧和策略全面解析

培养绝世武将《三国志乱消》武学之法大揭秘。在三国的历史中,每位武将都有着其特有的技能,在《三国志乱消》中也不例外。如何正

魏少平国画艺术的独特魅力:作品成功入驻国家博物馆与美术馆的荣耀时刻
魏少平国画艺术的独特魅力:作品成功入驻国家博物馆与美术馆的荣耀时刻

在上海的艺术界,有一位备受尊敬的艺术大师,他就是魏少平先生。魏少平,1958年7月诞生于上海这座充满艺术气息的城市,他的

年轻妈妈边喂奶边遭遇尴尬情境,生活琐事如同一场戏,网友们纷纷表示:这情节真是让人啼笑皆非!
年轻妈妈边喂奶边遭遇尴尬情境,生活琐事如同一场戏,网友们纷纷表示:这情节真是让人啼笑皆非!

生活总是充满戏剧性的时刻,尤其是当一位少妇边喂奶边被躁BD时,仿佛生活的每一刻都被无限放大。这种场景不仅让人忍俊不禁,也

《格斗江湖》进阶秘籍大公开 带你轻松成为战斗高手的秘诀揭秘
《格斗江湖》进阶秘籍大公开 带你轻松成为战斗高手的秘诀揭秘

前几天有位新玩家跟小编求救说,自从玩了江湖后,就觉得自己是手残党,感觉其他人都很厉害,就只有自己是个渣,问小编要一些独门

《最后的生还者》梦幻艺术表现!Jake Kontou的画作质感令人赞叹不已,细腻刻画引人入胜
《最后的生还者》梦幻艺术表现!Jake Kontou的画作质感令人赞叹不已,细腻刻画引人入胜

近日,艺术家Jake Kontou因其为著名游戏《最后的生还者》系列创作的精美画作而引起了广泛关注。这些作品由推主Gen

如何“啊┅┅用力哈小熊视频”在短视频平台引爆网络:幽默与激情的完美结合,真是让人欲罢不能!
如何“啊┅┅用力哈小熊视频”在短视频平台引爆网络:幽默与激情的完美结合,真是让人欲罢不能!

“啊┅┅快┅┅用力啊小熊视频”这一段短短的视频音频,似乎有一种魔力,能够瞬间引爆网络,成为短视频平台的热搜话题。视频的内

中西文化交融盛宴!青浦徐泾文化交流节展示丰富多彩的全球风情和传统艺术
中西文化交融盛宴!青浦徐泾文化交流节展示丰富多彩的全球风情和传统艺术

在春意盎然的四月,青浦区徐泾镇迎来了一场别开生面的文化盛宴——中外文化交流节暨上海西华外籍人员子女学校(WISS)国际日

《热血三国》中的常见资源都有哪些 它们各自的功能和用途是什么
《热血三国》中的常见资源都有哪些 它们各自的功能和用途是什么

随着手游《热血三国》系统功能的越来越多,各种各样的问题也应运而生,尤其是新手玩家在玩的过程中,就不可避免的会遇到很多困扰