文小言全新进化,多模态智能协同作战,开启语音与图片问答的全新能力!

百度在近期举办的AI DAY活动中,震撼发布了业内首个融合全新互相关注意力机制的端到端语音语言大模型。同时,文小言品牌也迎来了全面焕新与功能升级,成为首个接入该创新模型的应用,并新增了多模型融合调度、图片问答、AI生成图片与视频等强大功能。

百度AI产品创新业务领军人物薛苏表示:“AI的未来已不再是单纯的技术参数竞赛,关键在于如何通过多模型的协同合作,真正为用户带来实际价值。文小言致力于通过开放的生态系统,整合顶尖模型能力,打造出既强大又简洁的AI产品。”

文小言此次升级的核心亮点在于其“多模型融合调度”技术。该技术通过整合百度自研的文心X1、文心4.5等顶级模型,并引入DeepSeek-R1、可灵等第三方优质模型,实现了多模型间的智能协同。用户只需选择“自动模式”,系统即可智能选择最优模型组合,或根据用户需求灵活选择单一模型完成任务,从而显著提升了响应速度和任务处理能力。

例如,当用户要求设计三种不同风格的南偏东客厅效果图时,文小言能够准确理解装修风格差异,利用文心X1进行深度推理,快速生成三幅风格各异但视角一致的装修效果图。用户只需拍摄一张茅台镇的照片,文小言就能借助文心4.5的多模态分析能力,准确识别地理位置、当地产业、建筑风格等详细信息。

文小言还进一步增强了全新语音大模型、图片问答、AI生成图片与视频等能力,全面优化了用户体验。全新语音大模型支持方言对话、复杂知识问答及随时打断等场景,用户可以进行语音知识问答或进行趣味角色扮演。

据百度语音首席架构师贾磊介绍,该模型是百度在业内率先推出的基于全新互相关注意力机制的端到端语音语言大模型。在满足一定交互指标的情况下,大模型的调用成本相比行业平均水平降低了50%-90%,推理响应速度极快,将语音交互等待时间缩短至约1秒,极大地提升了交互的流畅性。同时,在大模型的加持下,实现了流式逐字的LLM驱动的多情感语音合成,使语音充满情感、逼真且拟人,进一步提升了交互的听觉体验。

图片问答功能让用户可以通过拍摄或上传图片,并以文字或语音提问的方式直接获取深度解析。例如,拍摄一道数学题可以实时生成解题思路与视频解析;上传多款商品图可以对比参数、价格,辅助用户做出购物决策;拍摄杯子设计图后,AI可以自动解析风格并生成同款手机壳、支架等周边产品。

文小言还新增了“图个冷知识”功能,为用户带来更多趣味性。用户可以预设“历史学者”、“科技达人”等角色视角,为同一图片赋予多维解读。例如,当用户询问“猫窗探秘:为何猫爱窗边”时,文小言能从狩猎本能、能量获取、领地意识等角度给出独特的解读。

猜你喜欢

梦幻西游手游科举考试所有题目及完整答案集合
梦幻西游手游科举考试所有题目及完整答案集合

科举考试源于隋朝,到了唐朝更是达到一个鼎盛的阶段,同端游一样,梦幻西游手游里玩家同样可以参加科举考试获得相应奖励。从乡试

地下城堡如何利用渥金神像获取更高阶资源的全面攻略与技巧分析
地下城堡如何利用渥金神像获取更高阶资源的全面攻略与技巧分析

为了让玩家在游戏中的体验度更好,地下城堡安卓版更新新玩法!地下城堡安卓版为大家带来了渥金神像玩法,如何使用渥金神像?怎样

梦幻西游手游装备栏空位的多重功能解析和利用策略
梦幻西游手游装备栏空位的多重功能解析和利用策略

梦幻西游手游中大家熟知的装备一共是六件,那么细心的玩家就会发现,在装备的下方多出来两个空格,很多玩家都会问是干什么的呢?

乱斗西游2亢金龙角色解析 亢金龙最佳阵容搭配和玩法攻略详解
乱斗西游2亢金龙角色解析 亢金龙最佳阵容搭配和玩法攻略详解

乱斗西游2手游中亢金龙是二十八星宿中最低调的一位,但修为却不容小觑。那么亢金龙是不是值得培养,技能属性怎么样?乱斗西游2

艾尔登法环中流派长袍的隐藏位置全面解析及获取指南
艾尔登法环中流派长袍的隐藏位置全面解析及获取指南

艾尔登法环上流阶级长袍隐藏位置全解析

天龙八部駮马宝宝的性能分析及详细属性图鉴评测,帮助你更好地了解駮马宝宝的特点
天龙八部駮马宝宝的性能分析及详细属性图鉴评测,帮助你更好地了解駮马宝宝的特点

天龙八部駮马宝宝怎么样?駮马宝宝属性图鉴。玩天龙八部手游的伙伴,知道天龙八部駮马宝宝怎么样?不知道的伙伴跟着小编一起来看

界外狂潮通行证等级提升最佳路线策略规划
界外狂潮通行证等级提升最佳路线策略规划

界外狂潮通行证档位升级路线最优规划

劲舞团手游如何高效提升情缘值 快速刷取情缘值的实用攻略与技巧分享
劲舞团手游如何高效提升情缘值 快速刷取情缘值的实用攻略与技巧分享

劲舞团手游是一款正版授权的次世代音舞手游,让喜欢跳舞的玩家可以在手机上体验指尖上的舞动,而且这款游戏功能也非常强大,还可