画家在画布上戳点,形成手绘作品独特的笔触。

你觉得这是哪部纪录片。
不不不。
视频中的每一帧都是AI生成的。
或者告诉它,来一个画布上的画笔特写,它就能直接创作出整个画面。
不仅可以凭空画出画笔,照着马头喝水也不是不可以。
还是那句话马儿喝水,这个AI抛出了这张图:
好家伙,这是以后做视频的节奏。真的是靠一张嘴...
是的,在那种情况下,AI绘制的文本到图像是蓬勃发展的,Meta AI这种情况下的研究人员对AI一代进行了超级进化。
这次真的可以用嘴做视频了:
人工智能被称为Make—A—Video,它直接从DALL的静态和稳定扩散中生成飙升的动态。
给它几个字或者几行文字,就能生成这个世界上实际上不存在的视频画面,还能掌握很多风格。
不仅纪录片风格能hold住,整个科幻效果也不错。
当两种风格混合在一起时,时代广场上跳舞的机器人似乎毫无矛盾感。
小文艺清新的动画风格,看来Make—A—Video也把握住了。
经过这么一波操作,真的让很多网友看傻了,连评论都简化成三个字母:
大个子乐村意味深长地说:该来的总会来。
毕竟在一句话生成视频之前,很多业内人士都觉得快。不过,元这一手真的有点快:
比我想象的快了九个月。
甚至有人说:我适应不了AI的进化速度...
文本生成模型的超级进化版本
你可能会认为Make—A—Video是DALL的视频版本。
实际上,差不多就是这么回事。
如前所述,制作视频是文本图像生成模型的超级进化那是因为这个AI工作的第一步实际上是依靠文本来生成图像的
从数据上看,是DALL E等静态图像生成模型的训练数据,是成对的文本—图像数据。
虽然Make—A—Video最终会生成视频,但它并没有使用成对的文本—视频数据进行专门训练
当然,视频也参与其中,但它主要是用一个单独的视频片段来教会AI如何在现实世界中移动。
具体到模型架构,Make—A—Video主要由三部分组成:
文本图像生成模型p
时空卷积层和注意层
一个用于提高帧速率的帧内插网络和两个用于提高图像质量的超级子网。
整个模型的工作过程就是酱阿姨的工作过程:
首先,根据输入文本生成图像嵌入。
然后,解码器Dt生成16帧64×64 RGB图像。
插值网络F将对初步结果进行插值,以实现理想的帧速率。
然后画面的分辨率会被第一个超分网络提升到256×256第二超级子网络继续优化,进一步提升画质至768×768
基于这一原理,Make—A—Video不仅可以根据文字生成视频,还具有以下能力。
将静止图像转换为视频:
从原始视频生成新视频:
刷新文本视频生成模型SOTA
事实上,Meta的Make—A—Video并不是第一次尝试从文本生成视频。
例如,清华大学和致远在今年早些时候推出了他们自研的一句话视频生成AI:CogVideo,并且这是目前唯一开源的T2V模型。
此前,GODIVA和微软的女娲也实现了根据文字描述生成视频。
可是这一次,视频制作的质量明显提高了。
在MSR—VTT数据集上的实验结果表明,Make—A—Video大大刷新了SOTA在FID和CLIPSIM上的成绩。
此外,Meta AI的团队还使用Imagen的DrawBench进行了主观评测。
他们邀请测试人员体验制作视频,并主观评价视频和文本之间的逻辑对应关系。
结果表明,制作视频在质量和逼真度上都优于其他两种方法。
还有一点
有趣的是,Meta在发布新AI的同时,似乎也拉开了T2V机型竞赛的序幕。
StabilityAI,stability Diffusion的母公司,坐不住了。创始人兼首席执行官艾玛德说:
我们将发布一个比制作视频更好的模型,每个人都可以使用的模型!
就在几天前,一篇相关论文出现在ICLR网站上。
生成的效果是这样的:
对了,虽然Make—A—Video还没有公开,但是Meta AI官方也表示已经准备推出试玩版让大家实际体验一下,有兴趣的朋友可以蹲一会儿~
论文地址:
参考链接:
。声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
环旭电子毛利率创上市十年新低,股价跌跌不休,连续回购有
图片来源:图虫3月28日,环旭电子(601231.SH)披露2021年年度报告称,该公司去...
两个20CM涨停,津荣天宇拟10转8派3,上市没满周年
图片来源:图虫创意3月29日,津荣天宇(300988.SZ)再次“20CM涨停”,收于44...
在管面积翻倍,碧桂园服务称大规模收并购已过去
图片来源:碧桂园服务结束过去一年来的大举收并购后,在3月29日召开的2021年度业绩发布会...
首套房利率降至5.2%,武汉楼市政策也放松了
去年被投资客们看好的武汉楼市,近期也继续出台了楼市刺激政策。界面新闻获悉,武汉房贷利率出现...
英国通胀创30年来最快增速,政府宣布立即降调燃油税
2022年3月9日,英国丹伯里,埃克森美孚公司运营的埃索加油站。图片来源:视觉中国英国政府...
让孩子自信互动才是幼儿园质量“金标准”
让孩子自信互动才是幼儿园质量“金标准” “入园难、入园贵”的问题终于不那么令人焦灼了。近年...
佳通轮胎获行业“十大轮胎品牌”等奖项
近日,由中国轮胎商务网发起主办、善养汽车联合主办的ApexTire2021中国轮胎年度大选...
快手2021年营收811亿元,调整后净亏损188.5亿
,快手今日公布了2021年第四季度及全年财报。财报显示,该公司第四季度营收244亿元,同比...
奇安信2022年新增订单超9亿元同比增长超65%
3月29日,奇安信发布关于近期经营情况的公告。公告显示,目前公司在手订单超23亿元,202...
大摩:苹果、谷歌等大型科技企业股票反弹,亚马逊、英伟达
北京时间3月29日早间消息,据报道,摩根士丹利财富管理公司表示,美国主要的科技和互联网股票...
万科蝉联第一2022房企综合实力TOP500测评成果出
3月29日,2022房地产开发企业综合实力测评成果正式发布,“房地产开发企业综合实力TOP...
华为加码芯片研发:海思升格为一级部门
华为本周发布2021年年度报告,从华为2021年的最新业务架构来看,海思已经从2012实验...
LGDisplay加码抢占中国透明显示市场
LGDisplay于3月29日至31日在北京东外56号文创园,以“YourLifewith...
一汽-大众奥迪赛车队加冕中国超级跑车锦标赛2021赛季
2022年3月24日,代表一汽-大众奥迪赛车队出征中国超级跑车锦标赛(ChinaGT)20...
StrategyAnalytics:
根据StrategyAnalytic...
增程技术成2022百人会热门增程式S
3月27日,中国电动汽车百人会论坛(...
工信部:1-2月份我国软件业务收入1
近日,工信部发布《2022年1-2月...
元宇宙进行时,高通在行动
近期,高通宣布设立总金额达1亿美元的...
Ultrasuede®携手智己L7打
环保可持续发展的理念不断融于各行各业...