Cohere推出革命性多模态AI模型Aya Vision,提供32B和8B两个不同规格版本,以满足不同需求

人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。该实验室声称,该模型在行业内处于领先地位。

QQ_1741243943019.png

Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。Cohere 表示,他们通过 WhatsApp 免费提供 Aya Vision,希望能让世界各地的研究人员更方便地获取技术突破。

QQ_1741243964274.png

Cohere 在其博客中指出,尽管人工智能已经取得了显著进展,但在不同语言之间的模型表现仍存在很大差距,尤其是在涉及文本和图像的多模态任务中。“Aya Vision 的目标就是帮助缩小这一差距。”

Aya Vision 有两个版本:Aya Vision32B 和 Aya Vision8B。更为先进的 Aya Vision32B 被称为 “新边界”,在某些视觉理解基准测试中表现超越了体量为其两倍的模型,包括 Meta 的 Llama-3.290B Vision。同时,Aya Vision8B 在某些评估中表现也优于一些体量为其十倍的模型。

QQ_1741243979235.png

这两个模型在 AI 开发平台 Hugging Face 上以 Creative Commons4.0许可证的形式提供,用户需遵循 Cohere 的可接受使用附录,且不可用于商业应用。

Cohere 表示,Aya Vision 的训练采用了一种 “多样化的” 英语数据集,实验室将这些数据集翻译后,使用合成标注进行训练。合成标注是指由 AI 生成的标注,有助于模型在训练过程中理解和解释数据。尽管合成数据存在潜在缺点,但像 OpenAI 等竞争对手也在越来越多地使用合成数据来训练模型。

Cohere 指出,使用合成标注训练 Aya Vision 使得他们能够减少资源的使用,同时仍能取得竞争力的表现。“这展示了我们对效率的重视,利用更少的计算资源实现更多成果。”

为了进一步支持研究界,Cohere 还发布了一套新的基准评估工具 ——AyaVisionBench,旨在考察模型在视觉与语言结合任务中的能力,如识别两张图像的差异和将屏幕截图转换为代码。

当前,人工智能行业正面临所谓的 “评估危机”,这主要源于流行基准的广泛使用,这些基准的总分与大多数 AI 用户关心的任务的能力相关性较差。Cohere 声称,AyaVisionBench 为评估模型的跨语言和多模态理解提供了一个 “广泛且具有挑战性” 的框架。

官方博客:https://cohere.com/blog/aya-vision

划重点:  

🌟 Aya Vision 模型被 Cohere 称为行业最佳,能够执行多种语言和视觉任务。  

💡 Aya Vision 有两个版本,分别为32B 和8B,表现超越体量更大的竞争模型。  

🔍 Cohere 还发布了新的基准评估工具 AyaVisionBench,旨在改善 AI 模型评估问题。  

猜你喜欢

热议中的十九岁日本免费完整版电视剧:探讨为何其在年轻观众中获得如此高人气
热议中的十九岁日本免费完整版电视剧:探讨为何其在年轻观众中获得如此高人气

《十九岁日本免费版全集电视剧》:这部剧为何在年轻观众中爆火?带你了解剧情魅力与观看方式近年来,越来越多的年轻人开始追看日

在书画中感受谦逊与温暖,滋养心灵之泉,共享四季的柔美与宁静
在书画中感受谦逊与温暖,滋养心灵之泉,共享四季的柔美与宁静

在艺术的浩瀚星空中,书画以其独特的韵味,成为心灵的灯塔,照亮着每一个寻求宁静与美好的灵魂。近日,一系列书画作品以其深刻的

修真神识技能点获取的有效方法与技巧分享,助你轻松提升修真境界
修真神识技能点获取的有效方法与技巧分享,助你轻松提升修真境界

在想不想修真这款游戏中,神识技能点是提升角色实力、解锁更多神通技能的关键资源。玩家可以通过多种方式获取这些宝贵的技能点,

燕云十六声荧渊暗涌碎片获取途径及详细攻略分享-如何快速获得荧渊暗涌碎片
燕云十六声荧渊暗涌碎片获取途径及详细攻略分享-如何快速获得荧渊暗涌碎片

燕云十六声中荧渊暗涌碎片共有三个,玩家们需要通过与柳青衣墓碑互动、击败无相皇以及与虚影互动即可获得,接下来就由小编给大家

孔子形象中的门牙突出,背后到底蕴藏了怎样深厚的文化寓意与哲理?
孔子形象中的门牙突出,背后到底蕴藏了怎样深厚的文化寓意与哲理?

近日,有关中国古代伟大思想家孔子的一项独特特征引起了广泛关注:众多历史画像中的孔子,无一例外地展现了他那两颗醒目的大门牙

新手玩家在《这就是江湖》中的前期游戏策略与玩法详解
新手玩家在《这就是江湖》中的前期游戏策略与玩法详解

在踏入这就是江湖的广袤世界之初,每一位新手玩家都怀揣着成为武林高手的梦想。然而,江湖路远,唯有步步为营,方能立足。以下是

四月春光明媚时,书法与绘画齐展自然风采与色彩
四月春光明媚时,书法与绘画齐展自然风采与色彩

四月,春光明媚,万物复苏,正是书画艺术绽放光彩的最佳时节。在这个充满生机与希望的季节里,书画大师们以笔墨为媒介,将四月的

凡人传说首次邂逅仙宗游戏体验与玩法分享的详细心得
凡人传说首次邂逅仙宗游戏体验与玩法分享的详细心得

在浩瀚无垠的人世间,每一个凡人都在为了生活奔波,追逐着那虚无缥缈的梦想与幸福。而我,一个平凡至极的书生,从未想过自己的命

探索鲁大师TV视频播放的新方式:利用智能推荐系统轻松寻找高清优质视频内容
探索鲁大师TV视频播放的新方式:利用智能推荐系统轻松寻找高清优质视频内容

鲁大师tv视频在线观看:如何快速找到你想要的内容?在当今信息化时代,在线视频的需求越来越大,特别是一些高质量的电视节目和

探讨塞尚静物画中物质质地与情感表达的和谐共生,揭示其如何塑造出独特的绘画美感
探讨塞尚静物画中物质质地与情感表达的和谐共生,揭示其如何塑造出独特的绘画美感

在艺术的浩瀚星空中,保罗·塞尚无疑是一颗璀璨的星辰,其绘画风格的发展历程充满了探索与革新。近期,关于塞尚艺术成就的讨论再