Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

首页 热门新闻 最新资讯

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

热搜大全 2024-02-23

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

白交 丰色 发自 凹非寺

量子位 | 公众号 QbitAI

Stable Diffusion 3,它终于来了!

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

足足酝酿一年之多,相比上一代一共进化了三大能力。

来,直接上效果!

首先,是开挂的文字渲染能力。

且看这黑板上的粉笔字:

Go Big or Go Home(不成功便成仁),这个倒是杀气腾腾啊~

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

路牌、公交灯牌的霓虹效果:

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

还有刺绣上 " 勾 " 得快要看到针脚的 " 晚安 ":

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

作品一摆出,网友就大呼:太精确了。

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

以至于有人表示:赶紧把中文也安排上啊。

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

其次,多主题提示能力直接拉满。

什么意思?你尽管一次性往提示词中塞入 n 多 " 元素 ",Stable Diffusion 3:漏一个算我输。

呐,仔细瞅下图,这里面就有 " 宇航员 "、" 穿着芭蕾舞裙的小猪 "、" 粉色雨伞 "、" 戴着礼帽的知更鸟 ",角落里还有 "Stable Diffusion" 几个大字(可不是什么水印)。

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

有了这个能力,一幅作品你想多丰富就有多丰富。

最后,当属图像质量,再次进化了一个度。

光看前面这些图,就被冲击到有没有?!

而各种超清特写,那是再信手拈来不过的了。

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

心动吗?目前官方已开放排队名单,大伙可以前往官网申请。

咳咳,也不得不说,最近这 AI 圈可真是相当热闹啊。

有网友直呼,我的电脑已经 Hold 不住了……

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

Stable Diffusion 3 来了!

全新的 Stable Diffusion 效果有多好,再给大伙奉送一些。

当然,所有出图均来自官方,比如 StabilityAI 媒体负责人:

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

不得不说,文字效果实在最为吸人眼球,各种形式都能呈现得相当清楚和 " 应景 "。

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

而看到上面这幅图,不得不想到 "Midjourney 尴尬亮相学术界:为生物学论文乱配图 " 一事——有了 SD3 之后,我们是不是可以制作非常专业的学术配图了?

除了这些,SD3 的 " 酒精水墨画 " 也相当别出心裁:

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

动漫风格:

again,你可以在上面加清晰的文字了。

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

由于目前需要排队申请,大伙还不好实际测试摸底。

不过有机智的网友已经用相同的提示词喂给了 Midjourney(v 6.0)。

比如开头的那张 " 红苹果与黑板字 "(prompt:cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk)

最终 Midjourney 给出的结果如下:

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

从这组对比来看,可以说是高下立判—— SD3 无论是文字拼写还是质量、色彩协调性等方面都更胜一筹。

技术方面,目前,模型可选择的参数范围在 800M 到 8B。

详细的技术报告还未公布,官方目前只透露主要结合了扩散型 transformer 架构以及 flow matching。

前者实际上同 Sora 一样,附上的技术论文正是 22 年 William Peebles 同谢赛宁合写的 DiT。

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

DiT 首次将 Transformer 与扩散模型结合到了一起,相关论文被 ICCV 2023 录用为 Oral 论文。

在该研究中,研究者训练了潜在扩散模型,用对潜在 patch 进行操作的 Transformer 替换常用的 U-Net 主干网络。他们通过以 Gflops 衡量的前向传递复杂度来分析扩散 Transformer ( DiT ) 的可扩展性。

而后者 flow matching 同样也是来自 22 年,由 Meta AI 以及魏茨曼科学研究所的科学家完成。

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

他们提出了基于连续归一化流(CNFs)的生成模型新范式,以及 flow matching 的概念,这是一种基于回归固定条件概率路径的矢量场的免模拟 CNFs 的方法。结果发现使用带有扩散路径的 flow matching,可以训练出来的模型更稳健和稳定。

不过最近看了这么多视频生成进展,也有网友表示:

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

你觉得呢?

One More Thing

除此之外,也就在前一天,他们的视频产品 Stable Video 正式开放公测。

基于 SVD1.1(Stable Video Diffusion 1.1),人人可用。

主要支持文生视频和图生视频两个功能。

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

最受喜欢

知更鸟 架构 公交 公众号 apple 热点 本地 社区 美图 视频 直播 资讯

曾被卖出19万美元高价!这台初代iPhone太猛了

曾被卖出19万美元高价!这台初代iPhone太猛了

科技热搜 iphone 智能手机 乔布斯 本初 谷歌 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

科技热搜 微软 机器人 小米 马斯克 欧盟 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

科技热搜 战神 steam 自杀小队 安德森 ceo 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

科技热搜 it之家 macbook 专利 传感器 苹果公司 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

科技热搜 台积电 三星 芯片 高通 半导体 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13