幻方量化重磅推出DeepSeek-V3:性能与GPT-4不相上下,训练成本创历史新低

幻方量化于12月26日晚发布全新一代大模型DeepSeek-V3,展现出惊人的技术突破。这款采用MoE(混合专家)架构的模型不仅在性能上媲美顶级闭源模型,其低成本高效率的特点更是引发业界关注。

从核心参数来看,DeepSeek-V3拥有6710亿参数,其中激活参数为370亿,在14.8万亿token的数据规模上完成预训练。相比前代产品,新模型的生成速度提升了3倍,每秒可处理60个token,显著提升了实际应用效率。

image.png

在性能评测方面,DeepSeek-V3展现出卓越实力。它不仅超越了Qwen2.5-72B和Llama-3.1-405B等知名开源模型,更在多项测试中与GPT-4和Claude-3.5-Sonnet不相上下。特别是在数学能力测试中,该模型以优异成绩超越了所有现有开源和闭源模型。

最引人注目的是DeepSeek-V3的低成本优势。根据开源论文披露,按每GPU小时2美元计算,模型全部训练成本仅为557.6万美元。这一突破性成果得益于算法、框架和硬件的协同优化。OpenAI联合创始人Karpathy对此给予高度评价,指出DeepSeek-V3仅用280万GPU小时就达到了超越Llama3的性能,计算效率提升了约11倍。

在商业化方面,DeepSeek-V3的API服务定价虽较上一代上调,但仍保持较高性价比。新版本定价为每百万输入tokens0.5-2元,输出tokens8元,总成本约为10元人民币。相比之下,GPT-4的同等服务价格约为140元人民币,价格差距显著。

作为一款全面开源的大模型,DeepSeek-V3的发布不仅展示了中国AI技术的进步,更为开发者和企业提供了一个高性能、低成本的AI解决方案。

猜你喜欢

崩坏学园2圆神弓箭套的最佳搭配攻略与玩法解析
崩坏学园2圆神弓箭套的最佳搭配攻略与玩法解析

崩坏学园2圆神弓箭套是游戏中和魔法少女小圆联动出的一个武器套,圆神弓箭套的伤害是非常高的,而且对于破度要求也不是很高,下

共庆高唐民俗之美,线上展览邀您欣赏家乡独特风情与美好时刻!
共庆高唐民俗之美,线上展览邀您欣赏家乡独特风情与美好时刻!

近日,一场以“遇见高唐·最是家乡年味浓”为主题的优秀网络作品征集活动在高唐县热烈展开,该活动由县委网信办、共青团高唐县委

原神茸茸城堡大喵险第四天挑战攻略分享,让你轻松通关
原神茸茸城堡大喵险第四天挑战攻略分享,让你轻松通关

原神茸茸城堡大喵险第四关阿呆的奇幻乐园关卡已经开启了,需要玩家来参与完成其中的任务,不知道怎么解锁的玩家可以来看看小编分

如何高效刷无悔华夏名臣碎片的攻略与技巧分享
如何高效刷无悔华夏名臣碎片的攻略与技巧分享

无悔华夏名臣碎片是游戏中非常重要的一个合成材料,这个材料可以让玩家获得更多的名臣,名臣在游戏是不可或缺的,下面91小编带

“上方加上一个日下句的含义解析及其在写作中的巧妙运用方法
“上方加上一个日下句的含义解析及其在写作中的巧妙运用方法

上面添一个日下句是什么意思?在日常生活中,我们经常会听到“上面添一个日下句”的说法。那么,这个词语到底是什么意思呢?事实

海浪与旋律交融,阿那亚·虾米音乐节引领文化旅游新潮流
海浪与旋律交融,阿那亚·虾米音乐节引领文化旅游新潮流

在秦皇岛北戴河新区的蔚蓝海岸边,一场音乐的盛宴于8月30日至9月1日激情上演。2024阿那亚·虾米音乐节,汇聚了来自全球

无悔华夏名臣装备获取途径详解及相关攻略汇总
无悔华夏名臣装备获取途径详解及相关攻略汇总

无悔华夏游戏中的装备和其他游戏的叫法不太一样,文物就是游戏中的装备,而文物是无需玩家自己去挖出来的,下面91小编带来无悔

x7x7x7任意噪音再度提升,体验无与伦比的画质震撼感受!
x7x7x7任意噪音再度提升,体验无与伦比的画质震撼感受!

x7x7x7任意噪,这个看似平凡的数字组合,其实在画质提升上隐藏了大大的惊喜。经过一次系统性的优化,x7x7x7任意噪带

春联书写技巧分享!书法大家教你轻松创作既吉祥又美观的春联方法
春联书写技巧分享!书法大家教你轻松创作既吉祥又美观的春联方法

在春节期间,写春联、贴春联成为了许多中国家庭的传统习俗,营造出浓厚的节日氛围。近日,在保定市图书大厦举办的“全民阅读·周

如何顺利通过坎公骑冠剑世界13-1关卡的攻略与技巧分享
如何顺利通过坎公骑冠剑世界13-1关卡的攻略与技巧分享

坎公骑冠剑世界13-1是游戏中比较难通过的一个关卡,而且想要探索这个关卡是需要获得支线任务道具的,下面91小编带来坎公骑