2024年10月16日日发布:Stable Diffuion 3突然发布!与Sora同架构,一切都更逼真了

发布日期:2024-10-15 23:13

来源类型:在下邵小安 | 作者:濮淏轩

【老澳门开奖号码记录】【管家婆精准一肖一码必中一肖】【2024年澳门天天开奖结果】【新澳2024年精准资料期期】【澳门管家婆开奖结果】【2024澳门码今晚开奖号码】【查看二四六香港开码结果】【2024澳门精准正版澳门码】【白小姐今晚特马期期准2023年】【澳门开奖最快的】
【2024澳门今天晚上开什么号码】 【澳门澳彩】 【2024新奥历史开奖记录香港1】

白交 丰色 发自 凹非寺

量子位 | 公众号 QbitAI

Stable Diffusion 3,它终于来了!

足足酝酿一年之多,相比上一代一共进化了三大能力

来,直接上效果!

首先,是开挂的文字渲染能力

且看这黑板上的粉笔字:

Go Big or Go Home (不成功便成仁),这个倒是杀气腾腾啊~

路牌、公交灯牌的霓虹效果:

还有刺绣上“勾”得快要看到针脚的“晚安”:

作品一摆出,网友就大呼:太精确了

以至于有人表示:赶紧把中文也安排上啊

其次,多主题提示能力直接拉满。

什么意思?你尽管一次性往提示词中塞入n多“元素”,Stable Diffusion 3:漏一个算我输。

呐,仔细瞅下图,这里面就有“宇航员”、“穿着芭蕾舞裙的小猪”、“粉色雨伞”、“戴着礼帽的知更鸟”,角落里还有“Stable Diffusion”几个大字(可不是什么水印)。

有了这个能力,一幅作品你想多丰富就有多丰富。

最后,当属图像质量,再次进化了一个度。

光看前面这些图,就被冲击到有没有?!

而各种超清特写,那是再信手拈来不过的了。

心动吗?目前官方已开放排队名单,大伙可以前往官网申请。

咳咳,也不得不说,最近这AI圈可真是相当热闹啊。

有网友直呼,我的电脑已经Hold不住了……

Stable Diffusion 3来了!

全新的Stable Diffusion效果有多好,再给大伙奉送一些。

当然,所有出图均来自官方,比如StabilityAI媒体负责人:

不得不说,文字效果实在最为吸人眼球,各种形式都能呈现得相当清楚和“应景”。

而看到上面这幅图,不得不想到“Midjourney尴尬亮相学术界:为生物学论文乱配图”一事——有了SD3之后,我们是不是可以制作非常专业的学术配图了?

除了这些,SD3的“酒精水墨画”也相当别出心裁:

动漫风格:

again,你可以在上面加清晰的文字了。

由于目前需要排队申请,大伙还不好实际测试摸底。

不过有机智的网友已经用相同的提示词喂给了Midjourney(v 6.0)。

比如开头的那张“红苹果与黑板字”(prompt:cinematic photo of a red apple on a table in a classroom, on the blackboard are the words “go big or go home” written in chalk)

最终Midjourney给出的结果如下:

从这组对比来看,可以说是高下立判——SD3无论是文字拼写还是质量、色彩协调性等方面都更胜一筹。

技术方面,目前,模型可选择的参数范围在800M到8B。

详细的技术报告还未公布,官方目前只透露主要结合了扩散型transformer架构以及flow matching

前者实际上同Sora一样,附上的技术论文正是22年William Peebles同谢赛宁合写的DiT。

DiT首次将Transformer与扩散模型结合到了一起,相关论文被ICCV 2023录用为Oral论文。

在该研究中,研究者训练了潜在扩散模型,用对潜在 patch进行操作的 Transformer 替换常用的 U-Net 主干网络。他们通过以Gflops衡量的前向传递复杂度来分析扩散 Transformer (DiT) 的可扩展性。

而后者flow matching同样也是来自22年,由Meta AI以及魏茨曼科学研究所的科学家完成。

他们提出了基于连续归一化流(CNFs)的生成模型新范式,以及flow matching的概念,这是一种基于回归固定条件概率路径的矢量场的免模拟CNFs的方法。结果发现使用带有扩散路径的flow matching,可以训练出来的模型更稳健和稳定。

不过最近看了这么多视频生成进展,也有网友表示:

你觉得呢?

One More Thing

除此之外,也就在前一天,他们的视频产品Stable Video正式开放公测。

基于SVD1.1(Stable Video Diffusion 1.1),人人可用。

主要支持文生视频和图生视频两个功能。

参考链接:

[1]https://stability.ai/news/stable-diffusion-3[2]https://arxiv.org/abs/2212.09748[3]https://arxiv.org/abs/2210.02747[4]https://twitter.com/pabloaumente/status/1760678508173660543

— 完 —

量子位 QbitAI · 头条号签

【2024新奥马开奖查询】【澳门资料大全正版资料2024年免费】【香港精准资料期期准】【澳彩精准资料免费长期公开】【澳门天天好】【澳门天天最快开奖结果】【香港资料大全+正版资料2023年】【2024澳门天天开好彩大全开奖记录127期】【香港全年资料1一153期香】【2024年新奥特开奖记录查询表】
【新澳门开奖号码2024年今晚开奖结果】 【www澳门管家婆100282,C0m成语平特】 【新澳门2024年开奖记录】

雪伦·凯恩:

4秒前:不得不说,文字效果实在最为吸人眼球,各种形式都能呈现得相当清楚和“应景”。

Agudong:

9秒前:呐,仔细瞅下图,这里面就有“宇航员”、“穿着芭蕾舞裙的小猪”、“粉色雨伞”、“戴着礼帽的知更鸟”,角落里还有“Stable Diffusion”几个大字(可不是什么水印)。

凯尔·赛科特:

5秒前:org/abs/2210.

马克·弗利顿:

6秒前:结果发现使用带有扩散路径的flow matching,可以训练出来的模型更稳健和稳定。

钱琛:

9秒前:除此之外,也就在前一天,他们的视频产品Stable Video正式开放公测。

Jabre:

6秒前:当然,所有出图均来自官方,比如StabilityAI媒体负责人:

龚宇轩:

1秒前:路牌、公交灯牌的霓虹效果: