小米正式开源多模态大模型Xiaomi MiMo-VL,推动人工智能新时代的到来

近日,小米公司研发的MiMo-VL多模态模型接过MiMo-7B的接力棒,在多个领域展现出了强大的实力。该模型在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型Qwen2.5-VL-7B,在GUI Grounding任务上的表现更是可与专用模型相媲美,为Agent时代的到来做好了准备。

微信截图_20250530093852.png

MiMo-VL-7B在多模态推理任务上成绩斐然,尽管参数规模仅为7B,却在奥林匹克竞赛(OlympiadBench)和多个数学竞赛(MathVision、MathVerse)中大幅领先参数规模10倍大的阿里Qwen-2.5-VL-72B和QVQ-72B-Preview,同时也超越了闭源模型GPT-4o。在内部大模型竞技场评估真实用户体验时,MiMo-VL-7B超越GPT-4o,成为开源模型中的佼佼者。在实际应用场景中,该模型在复杂图片推理和问答上表现卓越,在长达10多步的GUI操作上也展现出不错的潜力,甚至能够帮助用户将小米SU7加购至心愿单。

MiMo-VL-7B全面的视觉感知能力得益于高质量的预训练数据以及创新的混合在线强化学习算法(MORL)。在多阶段预训练过程中,小米收集、清洗、合成了涵盖图片-文本对、视频-文本对、GUI操作序列等多种数据类型的高质量预训练多模态数据,总计2.4T tokens,并通过分阶段调整不同类型数据的比例,强化了长程多模态推理的能力。混合在线强化学习则融合了文本推理、多模态感知+推理、RLHF等反馈信号,并通过在线强化学习算法稳定加速训练,全方位提升了模型的推理、感知性能和用户体验。

相关链接:https://huggingface.co/XiaomiMiMo。

猜你喜欢

阿卡迪亚新手开局怎么玩
阿卡迪亚新手开局怎么玩

阿卡迪亚新手开局玩法还是比较重要的。这里小编为大家简单讲一些游戏介绍及方向,根据自己之前t服游玩体验及国服第一天的体验,

真女神转生5复仇达识未满129的迷宫探索全攻略与终极技巧分享
真女神转生5复仇达识未满129的迷宫探索全攻略与终极技巧分享

真女神转生5复仇达识未满129迷宫探索终极攻略

机动都市阿尔法如何获取兑换码以及兑换码的有效使用方式
机动都市阿尔法如何获取兑换码以及兑换码的有效使用方式

因为游戏还没有正式公测所以还没有相应的兑换码产出,但是大家可以前往游戏的官网,官网上除了预约的活动之外还有不少福利可以领

艾尔登法环中隐藏BOSS指头之母尤弥尔的解锁条件详细解析与攻略
艾尔登法环中隐藏BOSS指头之母尤弥尔的解锁条件详细解析与攻略

艾尔登法环隐藏BOSS指头之母尤弥尔解锁条件解析

宝可梦大探险中雷伊布的进化方式及条件详解
宝可梦大探险中雷伊布的进化方式及条件详解

宝可梦大探险游戏中雷伊布在游戏中的人气也是非常的高的,那么宝可梦大探险进化雷伊布需要什么呢?接下来就让我们一起来看看宝可

梦幻新诛仙林惊羽实力如何分析及其战斗技巧详解
梦幻新诛仙林惊羽实力如何分析及其战斗技巧详解

在梦幻新诛仙中有不少的挑战,每个挑战的完成方法都是不同的,林惊羽就是其中之一,那么在游戏中林惊羽怎么打才能通关?下面就

博德之门3获取无情光芒戒指的实战技巧与必备策略解析
博德之门3获取无情光芒戒指的实战技巧与必备策略解析

博德之门3必拿装备无情光芒戒指实战技巧

光遇沾沾自喜的自恋狂如何进行兑换 兑换后能获得哪些有价值的物品
光遇沾沾自喜的自恋狂如何进行兑换 兑换后能获得哪些有价值的物品

光遇小王子季中有不少的先祖,沾沾自喜的自恋狂就是其中一个先祖,玩家找到他后可以兑换不少的物品,那么沾沾自喜的自恋狂怎么兑

暗黑破坏神4萃取威能资源的高效利用与优化策略探讨
暗黑破坏神4萃取威能资源的高效利用与优化策略探讨

暗黑破坏神4萃取威能资源优化策略

哈利波特魔法觉醒中最强纽特卡组推荐及搭配技巧分享
哈利波特魔法觉醒中最强纽特卡组推荐及搭配技巧分享

在哈利波特魔法觉醒中有不少的卡牌,这些卡牌可以组成不同的卡组,纽特就是其中之一,那么纽特卡组怎么搭配比较好?下面就来看