一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

首页 热门新闻 最新资讯

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

热搜大全 2024-01-25

鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

谷歌一出手,又把 AI 视频生成卷上了新高度。

一句话生成视频,现在在名为 Lumiere 的 AI 操刀下,可以是酱婶的:

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

△ " 阳光明媚,帆船在湖中航行 "

如此一致性和质量,再次点燃了网友们对 AI 视频生成的热情:谷歌加入战局,又有好戏可看了。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

不止是文生视频,Lumiere 把 Pika 的 " 一键换装 " 也复现了出来。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

左谷歌右 pika,同样是选中区域一句话完成视频编辑,你 pick 哪一边?

让图片中静止的火焰跃动起来,也同样一选就能完成:

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

还有图片转视频:

视频风格化:

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

总之就是主打一个质量又高又全能。

更多细节,我们论文扒起 ~

用于视频生成的时空扩散模型

Lumiere 旨在解决以往视频生成中存在的几个关键问题:

1

真实性

2

多样化

3

运动的连贯性

在此前的方法中,常见的做法是,扩散模型先生成一些稀疏的关键帧,而后通过一系列时间超分辨率(TSR)模型来填补关键帧之间的空白,接着再用空间超分辨率模型获取高清视频结果。

可以想见,在全局连贯性上,这样的做法存在先天的缺陷。

Lumiere 的创新点在于,提出了时空 U-Net(STU-Net)架构:将视频在空间和时间两个维度同时进行下采样和上采样,在网络的中间层得到视频的压缩时空表示。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

具体来说,基于这一架构,模型能够一次性生成视频中的所有帧——这也就提升了生成视频的连贯性。

同时,因为大部分计算发生在压缩后的表示上,STU-Net 能有效减少计算量,降低对计算和内存的需求。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

另外,为了提升视频的分辨率,研究人员使用多重扩散(MultiDiffusion)技术,通过线性加权空间超分辨率网络来处理重叠时间窗口带来的边界伪影等问题,从而能将生成画面融合为一个整体,得到连贯、高清的视频效果。

时长和分辨率方面,Lumiere 能输出 1024 × 1024、16fps 下长 5 秒的视频。

研究人员提到:

5 秒已经超过了大多数视频作品中的平均镜头长度。

值得一提的是,得益于时空 U-Net 架构端到端全帧率视频生成的能力和高效计算,Lumiere 灵活可扩展,可以轻松应用到下游任务中,包括文生视频、图生视频、视频风格化、视频编辑修复等等。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

△视频修复

实验结果

研究人员将 Lumiere 与其他文本 - 视频生成模型进行了实验对比。

首先来看人类用户的判断。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

实验设计是这样的:志愿者会同时看到一对视频,一个来自 Lumiere,另一个来自其他基线模型。志愿者被要求从中选出视觉质量、动态效果更好,更符合文本提示的视频。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

研究人员收集了大约 400 份反馈,结果显示,在视频质量、文本匹配度方面,Lumiere 超越了 Pika、Gen2、Imagen Video、SVD 等一众顶级视频生成模型。

同时,在 UCF101 数据集(动作识别数据集)上,与 MagicVideo、Make-A-Video、SVD 等模型相比,Lumiere 取得了具有竞争力的 FVD 和 IS 指标。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

网友:谷歌,模型呢?

效果很惊艳,网友很兴奋,但桥豆麻袋……

这次,谷歌依然只放出了论文,没有试玩,更没有开源。

这种似曾相识的操作,把人快整麻了:

视频很不错,但是谷歌,你又不打算发布任何代码、权重,也不提供 API 了,对吗?

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

还有人想起了 Gemini 发布时那个造假的小蓝鸭视频……

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度

那么,这波你还会看好谷歌吗?

最受喜欢

衣服 姐姐 高度 一句话 谷歌 热点 本地 社区 美图 视频 直播 资讯

曾被卖出19万美元高价!这台初代iPhone太猛了

曾被卖出19万美元高价!这台初代iPhone太猛了

科技热搜 iphone 智能手机 乔布斯 本初 谷歌 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

科技热搜 微软 机器人 小米 马斯克 欧盟 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

科技热搜 战神 steam 自杀小队 安德森 ceo 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

科技热搜 it之家 macbook 专利 传感器 苹果公司 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

科技热搜 台积电 三星 芯片 高通 半导体 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13