久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

Stable Diffusion 3 來了:生成圖片文字終于不亂碼了

人工智能
2024
02/24
17:34
機(jī)器之心
分享
評(píng)論

來源:機(jī)器之心

繼 OpenAI 的 Sora 連續(xù)一周霸屏后,昨晚,生成式 AI 頂級(jí)技術(shù)公司 Stability AI 也放了一個(gè)大招 —— Stable Diffusion 3。該公司表示,這是他們最強(qiáng)大的文生圖模型。

與之前的版本相比,Stable Diffusion 3 生成的圖在質(zhì)量上實(shí)現(xiàn)了很大改進(jìn),支持多主題提示,文字書寫效果也更好了。以下是一些官方示例:

提示:史詩般的動(dòng)漫作品,一位巫師在夜晚的山頂上向漆黑的天空施放宇宙咒語,咒語上寫著 "Stable Diffusion 3",由五彩繽紛的能量組成(Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy)

提示:電影照片,教室的桌子上放著一個(gè)紅蘋果,黑板上用粉筆寫著 "go big or go home" 的字樣(cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk)

提示:一幅畫,畫中宇航員騎著一只穿著蓬蓬裙的豬,撐著一把粉色的傘,豬旁邊的地上有一只戴著高帽的知更鳥,角落里有 "stable diffusion" 的字樣(a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words "stable diffusion")

提示:黑色背景上變色龍的攝影棚特寫(studio photograph closeup of a chameleon over a black background)

此外,Stability AI 媒體主管也曬出了一些生成效果:

Stability AI 表示,Stable Diffusion 3 是一個(gè)模型系列,參數(shù)量從 800M 到 8B 不等。這個(gè)參數(shù)量意味著,它可以在很多便攜式設(shè)備上直接跑,大大降低了 AI 大模型的使用門檻。

此外,Stability AI 還透露,他們和 Sora 一樣,在新模型中采用了 diffusion transformer 架構(gòu),并在博客中鏈接了 William ( Bill ) Peebles 和謝賽寧合著的 DiT 論文。這篇論文目前的被引量是 201,今年有望大幅增長。

不過,現(xiàn)在,Stable Diffusion 3 還沒有全面開放,權(quán)重也沒有公布。團(tuán)隊(duì)提到,他們正在采取一些安全措施,防止不法分子濫用。

該公司首席執(zhí)行官 Emad Mostaque 在 X 平臺(tái)的帖子中提到,在得到反饋并進(jìn)行改進(jìn)后,他們會(huì)把該模型開源。

很多人可能會(huì)好奇,這個(gè) Stable Diffusion 3 和 DALLE 3、Midjourney 比效果如何?有些人做了測(cè)試,看起來似乎沒有拉開明顯差距。不過,Stable Diffusion 3 是開源領(lǐng)域的希望。

值得注意的是,在 Stable Diffusion 3 發(fā)布的同一時(shí)間,外媒還傳出了 Stability AI 旗下圖像生成應(yīng)用公司 Clipdrop 被收購的消息??偛课挥诎屠璧?Clipdrop 成立于 2020 年 7 月,使用開源 AI 模型允許用戶生成和編輯照片。在 2023 年 3 月以未披露的金額出售給 Stability AI 之前,它已從 Air Street Capital 籌集了種子投資。當(dāng)時(shí),Clipdrop 表示它擁有超過 1500 萬用戶。但僅僅一年之后,Stability AI 就將它賣給了美國寫作助理初創(chuàng)公司 Jasper。

有人評(píng)價(jià)說,Stable Diffusion 3 的發(fā)布就是在掩蓋這個(gè)消息。和很多 AI 創(chuàng)業(yè)公司一樣,Stability AI 面臨的困境在于其以驚人的速度燒錢,但卻沒有明確的盈利途徑。去年年底,該公司還傳出了 CEO 可能被投資者趕下臺(tái)的消息,公司本身可能也在尋求賣身。在這樣的背景下,Stability AI 迫切地需要提振投資者信心。

英國媒體評(píng)價(jià)說,這筆交易標(biāo)志著 Stability AI 戰(zhàn)略的逆轉(zhuǎn)。Emad Mostaque 在一份電子郵件聲明中表示,這筆交易將使該公司能夠繼續(xù)專注于開發(fā) " 尖端的開放模型 "。在 Stable Diffusion 3 的相關(guān)博客中,該公司也強(qiáng)調(diào)," 我們對(duì)確保生成式人工智能開放、安全和普遍可及的承諾仍然堅(jiān)定不移。" 目前看來,Stability AI 的前途仍不明朗。

Stable Diffusion 3 背后的技術(shù):Diffusion Transformer+Flow Matching

在博客中,Stability AI 公布了打造 Stable Diffusion 3 的兩項(xiàng)關(guān)鍵技術(shù):Diffusion Transformer 和 Flow Matching。

1. Diffusion Transformer

Stable Diffusion 3 使用了類似于 OpenAI Sora 的 Diffusion Transformer 框架,而此前幾代 Stable Diffusion 模型僅依賴于擴(kuò)散架構(gòu)。

Diffusion Transformer 是 Sora 研發(fā)負(fù)責(zé)人之一 Bill Peebles 與紐約大學(xué)助理教授謝賽寧最初在 2022 年底發(fā)布的研究,2023 年 3 月更新第二版。

論文探究了擴(kuò)散模型中架構(gòu)選擇的意義,研究表明 U-Net 歸納偏置對(duì)擴(kuò)散模型的性能不是至關(guān)重要的,并且可以很容易地用標(biāo)準(zhǔn)設(shè)計(jì)(如 Transformer)取代。

論文鏈接:https://arxiv.org/pdf/2212.09748.pdf

具體來說,論文提出了一種基于 Transformer 架構(gòu)的新型擴(kuò)散模型 DiT,并訓(xùn)練了潛在擴(kuò)散模型,用對(duì)潛在 patch 進(jìn)行操作的 Transformer 替換常用的 U-Net 主干網(wǎng)絡(luò)。他們通過以 Gflops 衡量的前向傳遞復(fù)雜度來分析擴(kuò)散 Transformer(DiT)的可擴(kuò)展性,各個(gè)型號(hào)的 DiT 都取得了不錯(cuò)的效果。

我們都知道,擴(kuò)散模型的成功可以歸功于它們的可擴(kuò)展性、訓(xùn)練的穩(wěn)定性和生成采樣的多樣性。在擴(kuò)散模型的范圍內(nèi),所使用的骨干架構(gòu)存在很大差異,包括基于 CNN 的、基于 Transformer 的、CNN-Transformer 混合,甚至是狀態(tài)空間模型。

用于擴(kuò)展這些模型以支持高分辨率圖像合成的方法也各不相同,現(xiàn)有方法或是增加了訓(xùn)練的復(fù)雜性,或是需要額外的模型,或是犧牲了質(zhì)量。潛在擴(kuò)散是實(shí)現(xiàn)高分辨率圖像合成的主要方法,但在實(shí)踐中無法表現(xiàn)精細(xì)細(xì)節(jié),影響了采樣質(zhì)量,限制了其在圖像編輯等應(yīng)用中的實(shí)用性。其他高分辨率圖像合成方法還有級(jí)聯(lián)超分辨率、多尺度損失、增加多分辨率的輸入和輸出,或利用自調(diào)節(jié)和適應(yīng)全新的架構(gòu)方案。

基于 DiT 的啟發(fā),Stability AI 進(jìn)一步提出了 Hourglass Diffusion Transformer ( HDiT ) 。這是一種隨像素?cái)?shù)量擴(kuò)展的圖像生成模型,支持直接在像素空間進(jìn)行高分辨率(如 1024 × 1024)訓(xùn)練。

這項(xiàng)工作通過改進(jìn)骨干網(wǎng)絡(luò)解決了高分辨率合成問題。Transformer 架構(gòu)可以擴(kuò)展到數(shù)十億個(gè)參數(shù),HDiT 在此基礎(chǔ)上,彌補(bǔ)了卷積 U-Net 的效率和 Transformer 的可擴(kuò)展性之間的差距,無需使用典型的高分辨率訓(xùn)練技術(shù)即可成功進(jìn)行訓(xùn)練。

論文鏈接:https://arxiv.org/pdf/2401.11605.pdf

研究者引入了一種 "pure transformer" 架構(gòu),獲得了一種能夠在標(biāo)準(zhǔn)擴(kuò)散設(shè)置中生成百萬像素級(jí)高質(zhì)量圖像的骨干結(jié)構(gòu)。即使在 128 × 128 等低空間分辨率下,這種架構(gòu)也比 DiT 等常見 Diffusion Transformer 骨干網(wǎng)絡(luò)(圖 2)的效率高得多,在生成質(zhì)量上也具有競爭力。另一方面,與卷積 U-Nets 相比,HDiT 在像素空間高分辨率圖像合成的計(jì)算復(fù)雜度方面同樣具備競爭力。

2. Flow Matching

使用 Flow Matching 技術(shù)的意義則在于提升采樣效率。

深度生成模型能夠?qū)ξ粗獢?shù)據(jù)分布進(jìn)行估計(jì)和采樣。然而,對(duì)簡單擴(kuò)散過程的限制導(dǎo)致采樣概率路徑的空間相當(dāng)有限,從而導(dǎo)致訓(xùn)練時(shí)間很長,需要采用專門的方法進(jìn)行高效采樣。在這項(xiàng)工作中,研究者探討了如何建立連續(xù)標(biāo)準(zhǔn)化流程的通用確定性框架。

這項(xiàng)究為基于連續(xù)歸一化流(CNF)的生成建模引入了一種新范式,實(shí)現(xiàn)了以前所未有的規(guī)模訓(xùn)練 CNF。

論文鏈接:https://arxiv.org/pdf/2210.02747.pdf

具體來說,論文提出了 "Flow Matching" 的概念,這是一種基于固定條件概率路徑向量場回歸訓(xùn)練 CNF 的免模擬方法。Flow Matching 與用于在噪聲和數(shù)據(jù)樣本之間進(jìn)行轉(zhuǎn)換的高斯概率路徑的通用族兼容(通用族將現(xiàn)有的擴(kuò)散路徑歸納為具體實(shí)例)。

研究者發(fā)現(xiàn),使用帶有擴(kuò)散路徑的 Flow Matching 可以為擴(kuò)散模型的訓(xùn)練提供更穩(wěn)健、更穩(wěn)定的替代方案。

此外,F(xiàn)low Matching 還為使用其他非擴(kuò)散概率路徑訓(xùn)練 CNF 打開了大門。其中一個(gè)特別值得關(guān)注的例子是使用最優(yōu)傳輸(OT)位移插值來定義條件概率路徑。這些路徑比擴(kuò)散路徑更有效,訓(xùn)練和采樣速度更快,泛化效果更好。在 ImageNet 上使用 Flow Matching 對(duì) CNF 進(jìn)行訓(xùn)練,在似然性和采樣質(zhì)量方面的性能始終優(yōu)于其他基于擴(kuò)散的方法,并且可以使用現(xiàn)成的數(shù)值 ODE 求解器快速、可靠地生成采樣。

THE END
廣告、內(nèi)容合作請(qǐng)點(diǎn)擊這里 尋求合作
ai
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點(diǎn)和立場。

相關(guān)熱點(diǎn)

9 月 17 日消息,紐約郵報(bào) 9 月 12 日發(fā)布博文,報(bào)道稱在印度航空 AI171 航班空難造成 241 人遇難后,兩位印度工程師推出“重生計(jì)劃”(Project REBIRTH)原型機(jī),號(hào)稱是全球首個(gè) AI 驅(qū)動(dòng)的飛機(jī)墜機(jī)生存系...
業(yè)界
9月16日,脈脈最新發(fā)布的《2025年AI人才流動(dòng)報(bào)告》顯示,今年1-7月,平臺(tái)AI新發(fā)崗位量同比增長超10倍,簡歷投遞量同比增長11倍。
業(yè)界
北京時(shí)間9月16日,彭博社周一發(fā)文稱,一度隱退的阿里創(chuàng)始人馬云“強(qiáng)勢(shì)回歸”,在公司戰(zhàn)略決策中的作用越來越大。
業(yè)界
北京時(shí)間9月10日,據(jù)科技網(wǎng)站TheVerge報(bào)道,蘋果備受期待的秋季發(fā)布會(huì)帶來了關(guān)于AirPods、Apple Watch、iPhone等多項(xiàng)硬件的更新消息。
業(yè)界
9 月 7 日消息,上月初,彭博社曾報(bào)道蘋果正在開發(fā)一款自研生成式 AI 搜索產(chǎn)品,并為此組建了全新的“答案、知識(shí)與信息”團(tuán)隊(duì)。
業(yè)界

相關(guān)推薦

1
3
久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

    9000px;">

      老鸭窝一区二区久久精品| 色综合色狠狠综合色| 91在线视频免费观看| 欧美精品v国产精品v日韩精品| 亚洲精品一线二线三线无人区| 日日夜夜精品视频免费| 日韩一区二区在线看| 国产综合色视频| 亚洲三级电影网站| 欧美日韩在线播放| 精品在线播放免费| 综合亚洲深深色噜噜狠狠网站| 91丝袜高跟美女视频| 首页国产丝袜综合| 国产精品乱码人人做人人爱| 色婷婷激情综合| 精品亚洲国产成人av制服丝袜 | 在线观看欧美精品| 日韩电影免费在线| 国产精品久久久久三级| 911精品产国品一二三产区| 国产福利一区在线| 免费在线观看不卡| 一区二区三区欧美在线观看| 久久理论电影网| 欧美日本一区二区在线观看| 成人avav影音| 国产麻豆精品theporn| 夜夜揉揉日日人人青青一国产精品| 精品福利二区三区| 日韩三级电影网址| 欧美日韩国产另类一区| 成人免费高清在线| 韩国三级中文字幕hd久久精品| 亚洲综合色在线| 亚洲欧洲av在线| 日本一区二区久久| 国产午夜精品久久久久久免费视| 欧美日韩视频不卡| 色综合久久综合网欧美综合网| 国产一区二区免费视频| 免费高清在线一区| 五月天一区二区三区| 一区二区欧美国产| 亚洲激情av在线| 最新欧美精品一区二区三区| 欧美激情在线看| 久久尤物电影视频在线观看| 欧美成人福利视频| 日韩一区二区免费视频| 88在线观看91蜜桃国自产| 欧美性xxxxxx少妇| 欧美性猛交xxxx黑人交| 欧美视频精品在线| 91精品国产综合久久小美女| 欧美精品777| 日韩久久久精品| 久久久三级国产网站| 久久婷婷综合激情| 国产精品久久久久久亚洲伦| 亚洲另类在线一区| 亚洲成人av中文| 日韩 欧美一区二区三区| 日韩电影在线免费| 精品一区二区影视| 国产不卡视频在线观看| 99国产精品99久久久久久| 91麻豆精品视频| 91精品国产色综合久久不卡电影| 日韩三区在线观看| 亚洲国产电影在线观看| 亚洲人成在线观看一区二区| 亚洲午夜激情网站| 激情小说欧美图片| 91在线丨porny丨国产| 69精品人人人人| 国产三级精品三级在线专区| 一区二区视频免费在线观看| 亚洲成人一区二区| 精品一区二区在线视频| 色老头久久综合| 精品国产91亚洲一区二区三区婷婷 | 国产suv精品一区二区883| 99免费精品视频| 欧美日韩精品系列| 国产精品婷婷午夜在线观看| 亚洲一区二三区| 国产成人激情av| 欧美理论片在线| 国产精品国产精品国产专区不片| 午夜在线成人av| jizzjizzjizz欧美| 日韩免费高清av| 亚洲一区二区三区在线播放| 精东粉嫩av免费一区二区三区| bt欧美亚洲午夜电影天堂| 欧美一级日韩一级| 综合av第一页| 国产乱子轮精品视频| 欧美日韩三级在线| 亚洲久草在线视频| 东方欧美亚洲色图在线| 日韩欧美第一区| 五月天网站亚洲| 色老汉av一区二区三区| 国产精品少妇自拍| 久久成人麻豆午夜电影| 欧美日韩国产一级二级| 亚洲国产毛片aaaaa无费看| 99久久国产综合色|国产精品| 精品国产网站在线观看| 亚洲成a人v欧美综合天堂 | 91精品国产综合久久香蕉麻豆| 国产精品久久三区| 国产91清纯白嫩初高中在线观看| 日韩一级免费一区| 日韩二区三区四区| 欧美一区二区在线视频| 日韩经典中文字幕一区| 欧美日韩国产另类不卡| 午夜在线成人av| 日韩一卡二卡三卡| 久久99久久精品欧美| 91精品国产手机| 麻豆精品久久久| 精品欧美乱码久久久久久1区2区 | 91精品久久久久久久久99蜜臂| 亚洲高清不卡在线观看| 欧美网站大全在线观看| 亚洲成av人片一区二区梦乃| 欧美日韩激情一区二区| 午夜成人免费视频| 欧美一区二区观看视频| 久久精品久久精品| 久久先锋影音av鲁色资源| 国产91富婆露脸刺激对白 | 亚洲欧美日韩成人高清在线一区| www.日韩在线| 亚洲欧美一区二区三区孕妇| 欧洲一区二区三区在线| 青青草97国产精品免费观看无弹窗版| 欧美一区二区私人影院日本| 韩国女主播成人在线| 国产精品毛片高清在线完整版| 99精品久久99久久久久| 五月激情综合婷婷| 久久一区二区视频| 91麻豆国产精品久久| 午夜日韩在线观看| 2020国产成人综合网| 成人激情图片网| 亚洲国产日韩一级| 亚洲精品一区二区三区福利| 成人av电影在线播放| 一区二区三区不卡视频在线观看| 7777精品伊人久久久大香线蕉完整版 | 久久一区二区视频| 99久久国产综合色|国产精品| 亚洲已满18点击进入久久| 精品久久久久久久久久久院品网| 成人av影视在线观看| 亚洲午夜电影在线| 欧美高清在线精品一区| 欧美日韩在线播放| 国产夫妻精品视频| 午夜国产精品一区| 一区二区三区四区精品在线视频| 欧美一级久久久久久久大片| av成人老司机| 国产综合成人久久大片91| 亚洲香肠在线观看| 国产视频在线观看一区二区三区 | 国产精品污网站| 日韩精品最新网址| 欧美亚一区二区| 粉嫩嫩av羞羞动漫久久久 | 91毛片在线观看| 国产福利一区二区三区在线视频| 午夜成人免费视频| 亚洲综合视频在线| 亚洲四区在线观看| 国产精品女同一区二区三区| 精品精品国产高清a毛片牛牛| 欧美中文字幕一区| 99久久精品费精品国产一区二区| 国产精品原创巨作av| 日本不卡视频在线观看| 亚洲在线观看免费视频| √…a在线天堂一区| 国产日韩一级二级三级| 久久久久久久久岛国免费| 日韩一区二区三区观看| 日韩一区二区三区观看| 日韩三级精品电影久久久| 欧美一区二区三区公司| 日韩一级大片在线观看| 欧美一区二区视频在线观看2020| 欧美老肥妇做.爰bbww| 欧美丰满一区二区免费视频| 9191成人精品久久|