久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

2025 年中國多模態大模型行業模型現狀 圖像、視頻、音頻、3D 模型等終將打通和融合

創投圈
2025
06/03
18:00
分享
評論

行業主要上市公司:阿里巴巴 ( 09988.HK,BABA.US ) ; 百度 ( 09888.HK,BIDU.US ) ; 騰訊 ( 00700.HK, TCEHY ) ;科大訊飛 ( 002230.SZ ) ;萬興科技 ( 300624.SZ ) ;三六零 ( 601360.SH ) ;昆侖萬維 ( 300418.SZ ) ; 云從科技 ( 688327.SH ) ;拓爾思 ( 300229.SZ ) 等

多模態大模型的模型路徑

多模態大模型的探索正在逐步取得進展,近年來產業聚焦在視覺等重點模態領域突破。理想中的 "Any-to-Any" 大模型,Google Gemini、Codi-2 等均是處于探索階段的方案,其最終技術方案的成熟還需要在各個模態領域的路線跑通,實現多模態知識學習,跨模態信息對齊共享,進而實現理想中多模態大模型。現階段產業主要的工作還是聚焦在視覺等典型的重點模態,試圖將 Transformer 大模型架構進一步在圖像、視頻、3D 模型等模態領域引入使用,完善各個模態領域的感知和生成模型,再進一步實現更多模態之間的跨模態打通和融合。

多模態大模型的圖像模型

早在 2023 年 LLM 的流行之前,過去產業界在對于圖像的理解和生成模型領域已經打下了堅實的基礎,其中也產生了 CLIP、Stable Diffusion、GAN 等典型的模型成果,孕育出了 Midjourney、DALL · E 等成熟的文生圖應用。而更進一步,產業界也在積極探索將 Transformer 大模型引入圖像相關任務領域 ( ViT,Vision Transformer;DiT,Diffusion Transformer ) ,探索統一視覺大模型的建立,以及將 LLM 大語言模型與視覺模型進行更加密切的融合,包括近年來的 GLIP、SAM、GPT-V 都是其中的重點成果。

注:利用真實文本描述,通過 CLIP 生成的圖像特征

多模態大模型的視頻模型

由于視頻本質上是由很多幀的圖像疊加而成,因此本質上語言與視頻模態的融合和語言和圖像具有相當多的互通之處,產業界也在嘗試將圖像生成模型遷移到視頻生成,先基于圖像數據進行訓練,再結合時間維度上的對齊,最終實現文生視頻的效果。其中近年來也產生了 VideoLDM、W.A.L.T. 等典型的成果,并在近期也出現了 Sora 這樣具有明顯突破性效果的模型,其在視頻生成領域沿用了 Diffusion Transformer 架構,并在視頻類場景首次呈現出 " 智能涌現 " 的跡象。

視頻本質上是一系列圖像的連續展示,圖片生成是視頻生成的基礎。圖片生成的主流技術即擴散模型同樣也是視頻生成的主流技術,目前主流的文生視頻模型的技術路線為基于文生圖模型,通過在時間維度加入卷積或注意力,在生成的關鍵幀基礎上實現時序對齊得到視頻。在此基礎上,插幀 + 超分、初始噪聲對齊、基于 LLM 增強描述等方法均有助于增強時序對齊能力,實現更高質量的視頻生成。Zero-shot 領域的一系列研究則能夠實現無需訓練,直接將圖片生成模型轉化為視頻生成模型。

多模態大模型的 3D 模型

實際上 3D 是由 2D+ 空間信息構成,因此類似于由圖像生成到視頻生成的延伸,2D 圖片的生成方法理論上也可以遷移到 3D 中。近年來產業界也在積極探索將圖像領域的 GAN、自回歸、Diffusion、VAE 等骨干模型在 3D 模型生成任務中的擴展,其中也產生了 3D GAN、MeshDiffusion、Instant3D 等重點的模型成果。但相比圖像和視頻生成,目前的 3D 模型生成技術還處于早期發展階段,相關模型的成熟度仍有較大提升空間。

3D 數據表征:包括網格 ( Mesh ) 、點云 ( Point clouds ) 等顯式表示,以及 NeRF ( Neural radiance fields,神經輻射場 ) 等隱式表示,還包括體素 ( Voxel grids,3D 空間中的像素 ) 這類混合表示,其中 NeRF 具有強大的三維表達能力和潛在的廣泛應用范圍,是 3D 數據表征的關鍵技術 ;

3D 數據集:包括 3D 數據 ( 數據量和精度有限 ) 、多視角圖片 ( 用途最為廣泛 ) 、單張圖片 ( 使用仍具有較大難度 ) 等。目前 3D 對象數據集仍然稀缺,代表性的數據集包括 ShapeNet ( Chang 等,2015 ) 構建了 5.1 萬個 3D CAD 模型,為 3D 數據集的充實做出開創貢獻 ;Deitke 等 ( 2023 ) 構建了 Objaverse 和 Objaverse-xl 數據集,分別有 80 萬和 1000 萬個 3D 對象 ;

3D 生成模型:前饋生成 ( 通過前向傳遞中直接生成結果 ) 、基于優化的生成 ( 每次生成需要迭代優化 ) 、程序生成 ( 根據規則創建 3D 模型 ) 、生成式新視圖合成 ( 生成多視角圖像 ) ;

3D 應用:包括 3D 人生成、3D 人臉生成、3D 物體生成、3D 場景生成等應用。

多模態大模型的音頻模型

語音相關的 AI 技術在過去多年中已經較為成熟,但近年來 Transformer 大模型在 AI 音頻領域的投入應用,還是成功推動了相關技術再上臺階,實現更優的音頻理解和生成效果,其中重點的項目成果包括 Whisper large-v3、VALL-E 等。語音技術沿革可分為三階段,深度學習驅動發展加速。語音技術主要向增強泛化能力的方向持續延伸,Transformer 架構引領語音技術迭代浪潮。泛化能力是指模型對于未經訓練的數據的適應能力,技術基礎來自具有強大學習能力的網絡架構和大量多樣化的數據訓練。語音模型泛化能力的增強主要體現在:從覆蓋單一語種到多語種和方言,從處理人聲到自然聲音、音樂,從簡單語音識別或合成到零樣本學習和多任務集成。

Omni 模型是利用 neural audio codec,主要是對音頻進行編碼以實現音頻合成。文本和聲波會先分別進入 embedding 和 adapter 進行編碼,再通過 Omni 模型進行合成和預測音頻的 token,最后通過擴散模型進行訓練,量化再用解碼器合成音頻。

來源:前瞻網

THE END
廣告、內容合作請點擊這里 尋求合作
OpenAI
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

相關推薦

1
3
久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

    9000px;">

      91美女在线观看| 成人av免费在线| 久久综合色播五月| 欧美亚洲国产一区二区三区va | 亚洲综合在线五月| 2024国产精品| 久久免费看少妇高潮| 欧美电影免费观看高清完整版在线 | 樱桃视频在线观看一区| 久久久久久久久久久黄色| 欧美一区二区三区婷婷月色| 欧美色图第一页| 欧美亚洲综合另类| 一本大道av一区二区在线播放| 岛国精品在线播放| 处破女av一区二区| 国产高清久久久| 不卡一卡二卡三乱码免费网站| 久久国产精品区| 麻豆传媒一区二区三区| 日本特黄久久久高潮| 日韩av电影免费观看高清完整版 | 精品国产免费人成电影在线观看四季 | 一区二区在线观看视频| 亚洲美女视频在线| 亚洲香蕉伊在人在线观| 午夜精品久久久久久久蜜桃app| 亚洲午夜视频在线| 久久国产精品区| 成人97人人超碰人人99| 欧美性受xxxx黑人xyx| 在线播放欧美女士性生活| 精品女同一区二区| 一区二区三区中文在线观看| 一区二区在线观看免费视频播放| 日韩 欧美一区二区三区| 成人影视亚洲图片在线| 精品视频资源站| 国产色产综合色产在线视频 | 欧美精品18+| 国产精品免费aⅴ片在线观看| 亚洲综合在线视频| 国产精品538一区二区在线| av亚洲精华国产精华精| 国产电影精品久久禁18| 欧美日韩国产三级| 一区二区三区欧美| 久久99精品国产麻豆婷婷洗澡| 国产精品灌醉下药二区| 久久精品水蜜桃av综合天堂| 高清成人在线观看| 激情av综合网| 1区2区3区欧美| 在线不卡免费av| 99久久99久久久精品齐齐| 免费不卡在线视频| 午夜精品爽啪视频| 一区二区成人在线| 中文字幕av不卡| 国产精品一区二区视频| 欧美日韩国产小视频| 一区二区三区在线视频免费| 盗摄精品av一区二区三区| 久久久久久免费| 国产九色sp调教91| 精品视频999| 666欧美在线视频| 亚洲成人中文在线| 欧美老肥妇做.爰bbww视频| 婷婷久久综合九色综合绿巨人| 成人h精品动漫一区二区三区| 91精品国产色综合久久ai换脸| 亚洲久草在线视频| 99re视频这里只有精品| 成人av网址在线观看| 欧美tickle裸体挠脚心vk| 日日欢夜夜爽一区| 国产一区中文字幕| 亚洲视频免费看| 欧美专区在线观看一区| 视频一区视频二区中文字幕| 欧美久久久久免费| 激情综合网最新| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 欧美日韩精品欧美日韩精品| 视频一区在线播放| 精品国产91亚洲一区二区三区婷婷| 美女网站一区二区| 91精品国产综合久久福利| 97久久精品人人爽人人爽蜜臀 | 日本中文字幕一区| 精品精品欲导航| 亚洲美腿欧美偷拍| 精品福利视频一区二区三区| 91网站视频在线观看| 免费精品视频最新在线| 中文av字幕一区| 欧美日韩亚洲另类| 福利电影一区二区| 中文字幕一区二区三区不卡| 欧美视频一区在线| 婷婷久久综合九色国产成人 | 91视频你懂的| 视频一区二区三区在线| 国产精品视频第一区| 欧美一级片在线| 欧美在线不卡一区| 国产一区在线观看麻豆| 日本伊人午夜精品| 亚洲成人av电影在线| 亚洲精品视频在线观看免费| 国产亚洲欧美中文| 国产精品网站一区| 久久精品欧美日韩| 久久一留热品黄| 久久婷婷综合激情| 久久久久久99精品| 中文字幕日韩一区二区| 欧美高清在线一区| 国产精品久久久久aaaa| 中国色在线观看另类| 欧美久久久一区| 91麻豆精品国产91久久久久久| 一本一道综合狠狠老| 天堂成人免费av电影一区| 亚洲bdsm女犯bdsm网站| 日韩影院免费视频| 精品在线亚洲视频| 国产999精品久久久久久绿帽| 国产suv精品一区二区6| 国产精品一区二区久久精品爱涩| 丁香婷婷深情五月亚洲| 97久久精品人人做人人爽| 欧美三级午夜理伦三级中视频| 欧美日韩精品一区视频| 91精品国产色综合久久不卡蜜臀| 日韩欧美国产系列| 国产精品嫩草影院com| 首页国产欧美日韩丝袜| 国产精品香蕉一区二区三区| 五月婷婷另类国产| 肉色丝袜一区二区| 99免费精品视频| 555www色欧美视频| 亚洲精品久久嫩草网站秘色| 久久精品国产999大香线蕉| 欧美日本乱大交xxxxx| 久久精品亚洲乱码伦伦中文| 亚洲18女电影在线观看| 成人国产电影网| 国产日韩欧美高清| 欧美一级xxx| 激情五月播播久久久精品| 麻豆成人久久精品二区三区小说| 色综合久久久网| 国产精品网曝门| 成人高清视频在线| 国产精品久久久久久久久免费桃花| 美女一区二区视频| 欧美一区二区观看视频| 亚洲精品一二三| 久久精品国内一区二区三区| 欧美一区二区大片| 久久机这里只有精品| 日韩精品中文字幕一区| 日韩av在线播放中文字幕| 欧美乱妇20p| 国产精品456露脸| 国产精品国产精品国产专区不蜜| 国产成人综合网| 国产精品青草久久| 97se亚洲国产综合自在线不卡 | 在线不卡中文字幕| 丝袜亚洲另类欧美| 日韩一级片网址| 高清成人免费视频| 男女男精品视频网| 精品少妇一区二区三区日产乱码 | 亚洲人成在线观看一区二区| 一本一道波多野结衣一区二区| 一个色妞综合视频在线观看| 欧美日韩精品一区视频| 一区二区三区在线免费观看 | 亚洲mv在线观看| 久久久一区二区三区| 99久久精品情趣| 久久国产日韩欧美精品| 91精品国产品国语在线不卡| 捆绑紧缚一区二区三区视频| 国产欧美一区二区精品婷婷| 欧美日韩国产片| 成人网在线播放| 奇米精品一区二区三区在线观看一| 欧美精品一级二级三级| 国产成人在线看| 久久精品99国产国产精| 亚洲高清中文字幕| 日韩一区日韩二区| 久久久五月婷婷| 精品国产区一区|