苹果公司采用“归一化流”技术,发布全新创新AI生图模型TarFlow,推动图像处理领域的进步

苹果公司最近发布了一篇重要论文,展示了他们在人工智能领域的最新进展。与业界普遍采用的扩散模型或自回归模型不同,苹果选择了一条被广泛忽视的道路 —— 归一化流(Normalizing Flows)技术。该技术的核心是通过数学变换,将真实世界的数据(例如图像)转化为结构化的噪声,并能将其恢复为清晰的图像样本。

image.png

归一化流的最大优势在于它能够精确计算生成图像的概率,而这是许多扩散模型无法做到的。这使得归一化流在那些对概率要求较高的任务中显得格外重要。不过,这种技术的研发成本相对较高,且早期模型常常存在模糊和缺乏细节的问题。

在此次研究中,苹果推出了一种名为 TarFlow(Transformer AutoRegressive Flow)的新型归一化流模型。该模型的工作原理是将一张待生成的图像分割成多个小块,并逐块生成相应的像素值。每个小块的生成都依赖于已生成部分的内容,这样可以有效避免将图像压缩为固定词汇表时造成的质量损失。

然而,TarFlow 在生成高分辨率图像时仍面临挑战,因此苹果提出了增强版的 STARFlow(Scalable Transformer AutoRegressive Flow)。该模型通过在 “潜空间” 中进行工作,首先生成图像的压缩表示,然后利用解码器进行放大。这种方法不仅提升了生成效率,同时也避免了大量像素值的预测,先关注图像的整体结构。

此外,STARFlow 在处理文本提示方面也有了显著改进。它不再依赖于内建的文本编码器,而是能够调用现有的语言模型,比如谷歌的小型语言模型 Gemma,这样就可以更灵活地处理用户的语言指令。通过这种方式,STARFlow 能够专注于图像细节的生成与优化,进一步提升了生成图像的质量。

苹果在 AI 生图领域的探索标志着他们在技术创新上的持续努力,也为未来的图像生成技术提供了新的思路和方向。

划重点:  

🌟 苹果采用 “归一化流” 技术开发新的 AI 生图模型,区别于传统的扩散模型。  

🖼️ TarFlow 模型通过拆分图像块生成,避免了压缩造成的质量损失。  

🚀 STARFlow 在潜空间工作,并支持调用现有语言模型优化文本提示处理。

猜你喜欢

奥拉星手游周年庆首次充值最划算攻略分享,教你如何选择最优充值方案
奥拉星手游周年庆首次充值最划算攻略分享,教你如何选择最优充值方案

奥拉星手游周年庆怎么玩?周年庆首充双倍重置?下面来看看91小编带来的奥拉星手游周年庆首充双倍重置。【周年庆】活动爆料本周

妄想山海中高等级战斗图腾的功能与作用解析,包括其对战斗策略和游戏体验的影响
妄想山海中高等级战斗图腾的功能与作用解析,包括其对战斗策略和游戏体验的影响

妄想山海高等战斗图腾有什么用?妄想山海高等战斗图腾奖励是什么?来看看91小编给大家整理的妄想山海高等战斗图腾详解吧!高等

揭秘神之天平大地盔甲隐藏任务的触发方式与攻略指南
揭秘神之天平大地盔甲隐藏任务的触发方式与攻略指南

神之天平大地盔甲隐藏任务触发攻略

在原神中,如何为女仆诺艾尔选择最佳的升级等级,以及她的能力提升效果分析
在原神中,如何为女仆诺艾尔选择最佳的升级等级,以及她的能力提升效果分析

原神是一个由著名厂商米哈游精心打磨的全新开放世界冒险游戏,你以为这是崩坏4吗?不!你将来到的是一款叫做提瓦特的幻想世界,

炉石传说酒馆战棋暗月奖品超级赢家效果解析与玩法心得
炉石传说酒馆战棋暗月奖品超级赢家效果解析与玩法心得

玩炉石传说的小伙伴们都知道,最近炉石传说酒馆战棋模式新增了暗月奖品的宝藏,这个宝藏是每到一定的回合数就能发现一个奖励,而

从零基础开始打造财阀大小姐inZOI的完美发型及配饰搭配技巧攻略
从零基础开始打造财阀大小姐inZOI的完美发型及配饰搭配技巧攻略

从零开始捏财阀大小姐inZOI发型-配饰搭配攻略

密室逃脱绝境系列9无人医院第3关攻略详解与玩法心得分享
密室逃脱绝境系列9无人医院第3关攻略详解与玩法心得分享

隐隐的神秘藏在医院的每个角落,我们从中能够发现什么,其中第三关是很多的玩家十分在意的,那么如何过呢,下面91小编就给玩家

阴阳师手游樱花妖在2021年选择御魂的最佳攻略与技巧
阴阳师手游樱花妖在2021年选择御魂的最佳攻略与技巧

在阴阳师手游中有很多好看的式神,樱花妖就是其中之一,这位式神外观非常美,很多玩家都很喜欢,那么2021樱花妖御魂怎么搭配

匹诺曹的谎言守望者全阶段技能解析与战斗策略全面攻略
匹诺曹的谎言守望者全阶段技能解析与战斗策略全面攻略

匹诺曹的谎言守望者全阶段招式拆解攻略