给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

让AI视频中任意主体保持一致!就在刚刚,人人都可轻松做到了。

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

而且只需一张图片,就能实现。

——上面的每一个马斯克视频,都来自同一张照片。

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

想玩的话,只需要用上清华系AI视频玩家生数科技旗下Vidu的最新功能,主体参照(Subject Consistency)。

该功能能够实现对任意主体的一致性生成,让视频生成更加稳定,也更加可控。

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

现在生成AI视频内容,想要做到‘言出法随’其实还很难,不确定性让视频内容对运镜、光效等的精细控制还是得不断抽卡。生数科技CEO唐家渝表示,角色一致性只能让人脸保持一致,而主体参照让主体整体造型都能保持一致,给了更大的创作空间。

这是继今年7月,生数Vidu面向全球用户上线文生视频与图生视频能力(单视频最长生成8s)后的再次更新。

这次功能上新依然非常友好:

面向用户免费开放,注册即可体验。

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

仅需一张图片实现主体可控

先来看看Vidu是怎么定义这个新功能的。

主体参照:允许用户上传任意主体的一张图片,然后由Vidu够锁定该主体形象,通过描述词任意切换场景,输出主体一致的视频。

划重点:任意主体

也就是说,无论是人还是动物,无论是真人还是动漫形象or虚构主体,无论是家具还是商品,都能通过这个功能在视频生成中实现一致性和可控性。

目前,所有的视频大模型中,仅有Vidu率先支持这种玩法。

不必光说不练,我们来看看真实效果。

人物主体

首先来看看以人物为主体。

上传一张87版《红楼梦》林妹妹的定妆照:

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

以画面中林妹妹为主体,利用主体参照功能,生成两条视频。

突然,林妹妹上台演讲了:

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

又一眨眼,妹妹已经坐在星爸爸喝咖啡了:

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

当然啦,真人可以作为生成视频的主体参照,虚拟角色/动漫人物同样可以。

比如输入一张漫画女孩:

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

生成视频效果是酱紫的:

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

这里附上一些官方给的小tips:

如需重点保持主体面容一致,需仅截取单一主体的清晰面容图

如需重点保持主体半身一致(面容+上半身服饰),仅需截取单一主体的清晰半身图

如需重点保持主体全身一致(全身特征),仅需截取单一主体的清晰全身图

动物主体

谁能不爱可爱狗狗!

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

把这张照片丢给Vidu,就能实现狗狗走草地上,一步一步靠近你。

镜头后拉和主体运动幅度表现都还不错。

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

商品主体

当把商品作为需要参照的主体时,在生成的视频中,商品外观和细节能在不同于图片的场景中保持一致。

就像下面这样:

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

沙发所在的场景,说变就变。

上面还能睡一个盖了毯子的小女孩,遮挡住沙发原有部分。

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

需要注意的是,当前版本仅支持单一主体的可控。

如果上传的图片有多个人物/物体,需要框选出单一主体进行生成。

Be Like:

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

不再两步走了

无论是制作短视频、动画作品还是广告片,主体一致、场景一致、风格一致都是共同的追求。

因此,AI视频生成内容想要有叙事效果,就需要不断往三个一致方面尽力靠拢。

尤其是就现实情况而言,实际的视频创作,内容往往围绕特定的对象展开——这往往也是视频生成内容最容易变形、崩坏的一点,尤其在涉及复杂动作和交互的情况下。

挠头,脑阔痛。

给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!

业界首先想到的办法是先AI生图、再图生视频。

说人话,就是用Midjourney、SD什么的,生成分镜镜头画面,让每张图里的主体保持一致,然后再进行图生视频,最后把每个视频片段拼接剪辑。

但一听就发现了,这样搞,无论是保持AI画图的一致性,还是后期拼拼剪剪,工作量都很大。

生数Vidu主体参照跟这个思路的不一样之处,就是不再两步走了。

而是通过上传主体图+输入场景描述词的方式,直接生成视频素材。

最后,我们来厘清以及区分三个概念:

图生视频(Image to Video)

角色一致性(Character to Video)

主体参照(Subject Consistency)

图生视频基本是现在AI视频生成的基操了。

它把输入的图片作为视频首帧,然后基于首帧画面的连续生成。

Bug是无法直接输出目标场景,限制了视频内容的多样性和场景的自由度。

角色一致性,主要集中在人物形象上起效果。

它能保证人物面部特征在动态视频中保持一致,但一般来说一致性只顾脸,不顾整体形象。

主体参照,面向任意主体。

同时在面向人物主体时,既可选择保持面部一致,也可选择保持人物整体形象的高度一致。

最后附上生数科技视频试玩链接,感兴趣的朋友可趁排队人不多,赶紧冲一波!

毕竟,免费的就是香,对吧(doge)。

体验直通车:www.vidu.studio

以上就是关于【给我一张脸、视频背景随你换:林黛玉都被清华理工男玩废了!】的相关消息了,希望对大家有所帮助!

主题测试文章,只做测试使用。发布者:联合网,转转请注明出处:https://www.anesthesia.org.cn/2024/09/12/21680.html

(0)
联合网的头像联合网
上一篇 2024年9月12日 下午3:12
下一篇 2024年9月12日 下午3:12

相关推荐

  • 航空公司1岁女童“被关厕所”事件,到底是什么阴间新闻?

    (视频来源于搜狐新闻) 她们先是将自己 和女娃锁在了厕所里, 防止她逃出去。 机舱里的厕所是相当狭窄的, 何况那里面还站了三个人? 被陌生人带到陌生环境的女娃, 更加惊恐了, 她歇斯底里地哭了起来, 伴随着凄厉的叫声。 而她们手指着小孩, 用生硬、严厉、 恶狠狠的语气对她说: “别哭”! “把嘴巴闭起来”! “不哭了就可以出去。” “有一点声音都不能出去!”…

    2024年8月28日
    2700
  • 晚饭的1个小改变 就能改善脂肪肝:后悔知道的太晚

    对于忙碌的上班族来说,通常是早餐随便对付几口,午餐点个外卖,只有晚餐可以吃的正经一点,备好一顿可口的晚餐,消除一天工作的疲劳。 可是不少人加班无常,晚餐时间经常难以掌控,有时候要到很晚才吃得上,甚至还要和朋友们深夜组局。这就要提醒一下大家了:晚餐吃不对或吃得晚,可不仅仅是长胖那么简单哦! 晚餐吃太晚危害多多 晚餐大多是每天的最后一餐,也是很多人和家人吃饭、与…

    2024年9月15日
    700
  • 《财经》总编辑王波明谢幕,90年代记者工资就发200万

    执掌财经杂志26年,总编辑王波明谢幕! 8月13日,王波明发表“期待《财经》再创辉煌”一文,表示在担任《财经》杂志总编辑26年后,由于已到退休年龄,辞去《财经》总编辑职务。 资料显示,王波明,汉族,毕业于美国哥伦比亚大学国际金融专业,中国改革开放后最早的一批留学生之一,曾在美国纽约交易所任职,担任中国证券市场设计研究中心总干事、《证券市场周刊》《财经》社长。…

    2024年8月14日
    3100
  • 村干部私自卖地被踢出族谱?村民:半真半假

    日前,广东当地一家媒体发视频称,揭阳某村两位村干部被踢出族谱,引发关注。 该村村民黄先生14日说,村干部在未经村民同意的情况下,售卖了村内土地的使用权,由此引发纠纷。黄先生说,踢出族谱并未走相关的流程,“只是村民的自发行为”。 黄氏宗祠。图/网络 将两位村干部踢出族谱的公告显示,“本村族下小辈黄某安及黄某招身为村领导不为本宗亲村民谋发展,谋福利,更是卖祖求荣…

    2024年9月15日
    1800
  • CAMM2内存性能实测:与标准DDR5几乎一模一样

    8月19日消息,CAMM2是一种新型的内存形态,各家主板、内存厂商都在大力推广。它紧紧贴在主板上,可以大大节省空间,但是对传统的DIMM形态,性能是否会有损失呢? 微星在其Z790 Project Zero Plus主板上实测了金士顿的DDR5-7200 CL38 CAMM2,对比主板是微星MAG Z790Tomahawk Max WiFi。 测试中,CAM…

    2024年8月19日
    2200

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信