谷歌 DeepMind 新研究:利用 AI 模型為無聲視頻配音

    每日快訊
    2024
    06/19
    22:02
    IT之家
    分享
    評論

    來源:IT之家 

    據谷歌 DeepMind 新聞稿,DeepMind 近日公布了一項利用 AI 為無聲視頻生成背景音樂的 "video-to-audio" 技術。

    IT 之家獲悉,當前 DeepMind 這款 AI 模型依然存在局限性,需要開發者使用提示詞為模型預先 " 介紹 " 視頻可能的聲音,暫時不能直接根據視頻畫面添加具體音效

    據悉,該模型首先會將用戶輸入的視頻進行拆解,此后結合用戶的用戶文字提示,利用擴散模型反復運算,最終以生成與視頻畫面協調的背景聲音,例如輸入一條 " 在黑暗中行走 " 的無聲視頻,再添加 " 電影、恐怖片、音樂、緊張、混凝土上的腳步聲 " 等文字提示,相關模型就能生成恐怖風格的背景音效。

    DeepMind 同時表示,該 "video-to-audio" 模型可以為任何視頻生成無限數量的音軌,還能夠通過提示詞內容判斷生成的音頻 " 正向性 " 或 " 反向性 ",從而令生成的聲音更貼近某些特定場景

    展望未來,DeepMind 表示研究人員正進一步優化這款 "video-to-audio" 模型,計劃未來能夠讓模型直接根據視頻內容,無須通過提示詞即可生成視頻背景音,同時還將改善視頻中人物對白的口型同步能力。

    THE END
    廣告、內容合作請點擊這里 尋求合作
    數碼
    免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

    相關熱點

    海通證券分析師杰夫普(Jeff Pu)近日發布投資簡報,認為蘋果公司已經開始構建基于 M2 Ultra 芯片的 AI 服務器。
    每日快訊
    一家 AI 初創公司 Suno 近日發布了首款能夠生成 " 廣播級 " 歌曲的工具,能夠在數秒之內創作出兩分鐘的完整歌曲,所有用戶均可免費訪問。
    評測
    小米官宣將于 2 月 22 日晚發布 Redmi Book Pro 2024 筆記本,號稱是 " 小米筆記本業務的全新篇章 ",用手機的產業能力深度賦能筆記本業務,并且全面接入小米澎湃 OS。
    每日快訊
    據國外媒體報道稱,iPhone 16 的所謂設計圖流出,而據此渲染出的效果是,回歸豎排雙攝。
    評測
    如果 Vision Pro 頭顯出現系統故障,用戶應該如何恢復呢?根據蘋果解鎖的最新細節,整個恢復過程類似于 Apple Watch 和 Apple TV,需要 iPhone 借助完成。
    每日快訊

    相關推薦

    1
    3
    主站蜘蛛池模板: 精品一区精品二区| 韩国福利一区二区美女视频| 国产综合无码一区二区三区| 久久精品一区二区三区不卡| 国产一区二区三区内射高清| 无码精品一区二区三区免费视频 | 亚洲乱色熟女一区二区三区丝袜| 国精产品一区一区三区| 日本一道一区二区免费看| 亚洲一区在线免费观看| 国产免费av一区二区三区| 成人区人妻精品一区二区不卡视频 | 精品欧洲av无码一区二区| 亚洲日韩中文字幕一区| 波多野结衣一区在线观看| 久久久久人妻精品一区蜜桃| 国产精品高清视亚洲一区二区| 变态调教一区二区三区| 国产精品视频一区| 日韩一本之道一区中文字幕| 中文字幕一区二区三区久久网站 | 午夜天堂一区人妻| 亚洲天堂一区二区三区四区| 国产一区二区好的精华液| 国产av成人一区二区三区| 一区二区三区日韩| 波霸影院一区二区| 色婷婷亚洲一区二区三区| 夜夜高潮夜夜爽夜夜爱爱一区| 日本免费电影一区二区| 国产精品一区二区三区99| 成人无号精品一区二区三区| 视频一区二区在线播放| 精品无码一区二区三区水蜜桃| 国产亚洲无线码一区二区| 无码人妻啪啪一区二区| 国产精品一区二区三区高清在线| 中文字幕亚洲乱码熟女一区二区| 视频一区二区三区人妻系列| 无码人妻AⅤ一区二区三区水密桃| 国产精品一区二区三区高清在线|