腾讯混元推出图生视频模型HunyuanVideo-I2V,带来对口型等创新玩法的全新体验

腾讯宣布开源其新研发的图像转视频生成框架 ——HunyuanVideo-I2V。该模型的发布是在其成功开源 HunyuanVideo 之后的又一重要进展,旨在推动开放源代码社区的深入探索。

QQ_1741250034750.png

HunyuanVideo-I2V 结合了先进的视频生成技术,能够将静态图像转换为生动的视频内容,为创作者提供了更多的可能性。用户只需上传一张图片,并简单描述希望画面的动态效果,便可以生成一段五秒的短视频。这款模型的特点在于它不仅能让静态图片 “动起来”,还能够自动配上背景音效,极大地增强了视频的趣味性和吸引力。

HunyuanVideo-I2V 利用了一个预训练的多模态大语言模型作为文本编码器,显著增强了模型对输入图像语义内容的理解能力。这意味着,用户输入的图像能够通过模型生成语义图像标记,这些标记与视频潜在标记相结合,从而实现更全面的全注意力计算。通过这种方式,系统能够最大限度地发挥图像和文本模态之间的协同作用,确保从静态图像生成的视频内容更具连贯性和真实感。

为了让更多用户体验这一功能,混元 AI 视频官网已经上线,用户可以直接访问网站进行操作。此外,企业和开发者也可以通过腾讯云申请 API 接口,将该技术融入自己的应用中。这款图生视频模型是混元文生视频模型开源工作的延续,模型总参数量达 130 亿,适合生成多种类型的角色和场景,涵盖写实视频、动漫角色和 CGI 角色等。

在具体使用过程中,用户还可以上传人物图片,并输入希望其 “对口型” 的文字或音频,系统就能够让图片中的人物 “说话” 或 “唱歌”。与此同时,混元还推出了 “动作驱动” 功能,用户可以一键生成相应的舞蹈视频,提升创作的多样性和趣味性。

值得一提的是,此次开源的图生视频模型已经在 Github 和 HuggingFace 等主流开发者社区发布,开发者可以下载相关内容进行试验与开发。开源内容包括模型的权重、推理代码以及 LoRA 训练代码,这些都为开发者提供了更多的可能性,以便在此基础上训练专属的 LoRA 模型。

自开源以来,混元视频生成模型的热度不断上升,去年 12 月更是登顶 HuggingFace 的全站趋势榜第一,Github 上的 Star 数已超过 8.9K。许多开发者也积极为 Hunyuanvideo 制作插件与衍生模型,目前已经积累超过 900 个衍生版本。早前开源的混元 DiT 文生图模型同样表现不俗,衍生模型数量达 1600 多个。

官网:https://video.hunyuan.tencent.com/

github:https://github.com/Tencent/HunyuanVideo-I2V

huggingface:https://huggingface.co/tencent/HunyuanVideo-I2V


猜你喜欢

朱梅邨山水画展:在墨色的世界中展现出雄壮与宁静的完美结合
朱梅邨山水画展:在墨色的世界中展现出雄壮与宁静的完美结合

朱梅邨,这位在1911年至1993年间活跃于中国画坛的艺术家,以其卓越的山水画作品赢得了广泛赞誉。他的画作不仅展现了深厚

如龙8外传夏威夷海盗宝石验证证书考试详细答案解析与攻略分享
如龙8外传夏威夷海盗宝石验证证书考试详细答案解析与攻略分享

在如龙8外传夏威夷海盗这款游戏中,宝石测验证书考试是玩家提升海盗等级点数的重要途径。然而,考试题目涉及广泛且部分较为复杂

五一假期不可错过!莎拉·布莱曼联袂韦伯呈现震撼音乐剧《日落大道》在武汉精彩上演
五一假期不可错过!莎拉·布莱曼联袂韦伯呈现震撼音乐剧《日落大道》在武汉精彩上演

武汉四月,樱花绽放如粉色云霞,点缀着这座城市的天空,正值五一假期,武汉迎来了来自四面八方的游客,城市的大街小巷、热门景点

性与交换的交响乐:探索人类情感与欲望交织下的复杂关系
性与交换的交响乐:探索人类情感与欲望交织下的复杂关系

《性的交换》正在播放:这部作品能否引起你对情感与欲望的深层思考?随着现代影视作品逐渐探索复杂的人际关系,《性的交换》正在

凡人传说中的无字天书与不朽智慧的启示之旅
凡人传说中的无字天书与不朽智慧的启示之旅

在古老而遥远的时代,有一本被称为“凡人传说无字天书”的奇书。它没有文字,却承载着无数关于人类历史、命运和智慧的秘密。据传

35岁开始学习摄影真的太晚了吗?掌握正确的方法,年龄根本不是问题!
35岁开始学习摄影真的太晚了吗?掌握正确的方法,年龄根本不是问题!

在当今社会,焦虑情绪弥漫,许多人不禁感叹青春易逝,担心被时代淘汰。这种心态也悄然渗透到了摄影领域,引发了关于“35岁现象

音乐盛会焕新城市精髓:太湖湾赋予文化旅游新的生机与活力
音乐盛会焕新城市精髓:太湖湾赋予文化旅游新的生机与活力

太湖湾音乐节:声与景的交响,文旅融合的新篇章五月的微风轻拂过太湖碧波,将音乐的浪潮带至常州武进区的丘陵地带。2025年,

在弓箭传说2中有效获取卷轴的各种方法与技巧分享
在弓箭传说2中有效获取卷轴的各种方法与技巧分享

在弓箭传说2这款游戏中,卷轴作为一种重要的道具资源,能够为战斗提供额外的增益效果。因此,玩家们都渴望获取更多的卷轴来提升

鸣潮守岸人角色上线时间究竟是什么时候-守岸人相关信息揭秘
鸣潮守岸人角色上线时间究竟是什么时候-守岸人相关信息揭秘

鸣潮游戏作为库洛米在2024年度上限的一款大型的二次元冒险游戏,8月4日随着1 2版本的更新,公开了新角色共鸣者“守岸人

郭沫若之妻于立群书法研究:探寻她的艺术传承与卓越成就
郭沫若之妻于立群书法研究:探寻她的艺术传承与卓越成就

于立群,作为文学巨匠郭沫若的第三任伴侣,其人生轨迹与书法艺术成就令人瞩目。她来自广西贺州的一个显赫家族,其祖父于式枚曾是