谷歌如何通過機器學習實現(xiàn)逼真AR實時自拍效果

    VR/AR
    2019
    03/11
    12:26
    映維網(wǎng)
    分享
    評論

    增強現(xiàn)實可以在物理世界之上疊加數(shù)字內(nèi)容與信息,從而增強你的感知。例如,谷歌地圖的AR功能可允許你直接看到疊加在現(xiàn)實世界視圖的方向。借助Playground,你就可以通過AR并以不同方式瀏覽世界。對于最新版本的YouTube Stories,以及ARCore全新的Augmented Faces API,你可以為自拍添加動畫面具,眼鏡,3D帽子等濾鏡。

    實現(xiàn)這種AR功能的關鍵挑戰(zhàn)之一是合理地將虛擬內(nèi)容錨定在現(xiàn)實世界。這個過程需要一套獨特的感知技術,需要能夠追蹤千差萬別的表面幾何,每一個微笑,每一次皺眉都要準確識別。

    為了實現(xiàn)這一切,谷歌采用機器學習來推斷近似的3D表面幾何形狀,只利用一個攝像頭輸入而無需專用的深度傳感器。利用面向移動CPU界面的TensorFlow Lite或可用的全新移動GPU功能,這種方法帶來了實時速度的AR效果。所述解決方案與驅動YouTube Stories全新創(chuàng)作者效果的技術相同,并已經(jīng)通過最新的ARCore SDK和ML Kit Face Contour Detection API向廣泛的開發(fā)者社區(qū)開放。

    1. 用于AR自拍的機器學習管道

    谷歌的機器學習管道由兩個協(xié)同工作的實時深度神經(jīng)網(wǎng)絡模型組成:一個在整張圖像上運行,并計算面部位置的探測器;在所述位置上運行,并通過回歸預測來近似表面幾何的通用3D網(wǎng)格模型。精確地裁剪面部可以大大減少對相同數(shù)據(jù)增強的需求,比方說由旋轉,平移和比例變化組成的仿射變換。通過精確地裁剪面部,這允許系統(tǒng)將大部分性能用于預測坐標,而這對于實現(xiàn)虛擬內(nèi)容的正確錨定至關重要。

    一旦裁剪了感興趣位置,網(wǎng)格網(wǎng)絡一次僅應用于單個幀,利用加窗平滑(windowed smoothing)以減少面部靜止時的噪點,同時避免在顯著移動期間出現(xiàn)延遲。

    對于3D網(wǎng)格,谷歌采用了傳遞學習,并訓練了一個具有多個目標的網(wǎng)絡:網(wǎng)絡同時利用合成渲染數(shù)據(jù)預測3D網(wǎng)格坐標,以及利用注釋的真實世界數(shù)據(jù)來預測2D語義輪廓。因而產(chǎn)生的網(wǎng)絡為谷歌提供了合理的3D網(wǎng)格預測,這不僅體現(xiàn)在合成上,同時體現(xiàn)在現(xiàn)實世界數(shù)據(jù)上。所有模型都接受來自地理不同的數(shù)據(jù)集數(shù)據(jù)培訓,隨后在平衡的,多樣化的測試集上進行測試,從而獲得定性和定量性能。

    3D網(wǎng)格網(wǎng)絡接收裁剪的視頻幀作為輸入。它不依賴于額外的深度輸入,因此同時可以應用于預先錄制的視頻。所述模型輸出3D點的位置,以及輸出在輸入中存在并合理對齊的可能面部。一種常見的替代方法是預測每個地標的2D熱圖,但這不適合深度預測,而且如此多的數(shù)據(jù)點需要高昂的計算成本。

    通過迭代引導和細化預測,谷歌進一步提高了模型的準確性和魯棒性,并允許他們就將數(shù)據(jù)集擴展至越來越具有挑戰(zhàn)性的案例,如鬼臉,斜角和遮擋。數(shù)據(jù)集增強技術同時擴大了可用的ground truth數(shù)據(jù),開發(fā)出對攝像頭缺陷或極端光照條件等問題的模型穩(wěn)定性。

    2. 專為硬件打造的界面

    谷歌利用TensorFlow Lite實現(xiàn)機載神經(jīng)網(wǎng)絡推理。在可用時,新推出的GPU后端加速能夠提升性能,并顯著降低功耗。另外,為了涵蓋廣泛的消費類硬件,谷歌設計了具有不同性能和效率特性的一系列模型架構。對于較簡單的網(wǎng)絡而言,最重要的區(qū)別是殘差塊(Residual Block)布局和有效的輸入分辨率(最簡單的模型為128×128像素,而最復雜的模型中為256×256)。谷歌同時改變了層數(shù)和子采樣率(隨網(wǎng)絡深度的輸入分辨率減少速度)。

    對于這一系列的優(yōu)化,結果是更簡單的模型能夠實現(xiàn)大量的提速,同時對AR效果質量的影響維持在最低幅度。

    谷歌的努力成果驅動著YouTube,ARCore和其他客戶端的逼真自拍AR效果。

    通過環(huán)境映射模擬光反射,實現(xiàn)眼鏡的逼真渲染通過將虛擬對象陰影投射到面部網(wǎng)格,實現(xiàn)了自然光照效果建模面部遮擋以隱藏面部后面的虛擬對象部分,如虛擬眼鏡

    另外,谷歌實現(xiàn)了逼真的妝容效果,方式是:

    建模應用于嘴唇的鏡面反射利用亮度感知材質來實現(xiàn)面部妝容

    谷歌表示:“我們很高興與創(chuàng)作者,用戶和開發(fā)者的分享這一全新的技術。如果有興趣,你可以馬上下載最新ARCore SDK。在未來,我們計劃將這項技術擴展至的更多的谷歌產(chǎn)品之中。”

    原文鏈接:https://yivian.com/news/57903.html

    來源:映維網(wǎng)

    THE END
    廣告、內(nèi)容合作請點擊這里 尋求合作
    VR
    免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點和立場。

    相關熱點

    Harmonix通過《Rock Band VR》,《Amplitude》和《Dance Central》等音樂節(jié)奏游戲打響了自己的名聲,而他們現(xiàn)在正希望通過《Audica》來嘗試不同的游戲玩法:將音樂和基于節(jié)奏的槍戰(zhàn)結合在了一起。你在游戲...
    VR
    準備好踏上中世紀的十字軍東征之旅吧。來自VitruviusVR的動作冒險RPG游戲《Shadow Legend VR》已經(jīng)登陸Oculus Rift(和Steam),售價24.99美元。作為圣殿騎士團的圣堂騎士,你需要拉弓瞄準,舉起利劍,釋...
    VR
    對于憑多人射擊游戲《Hover Junkers》和恐怖游戲《Duck Season》等內(nèi)容打響自己名堂的洛杉磯開發(fā)商Stress Level Zero,他們自2016年以來就一直在為社區(qū)帶來VR精品。這支團隊于2018年在Node YouTube頻道發(fā)...
    VR
    對于五角大樓的“Project Maven”(美國軍民融合方面的秘密人工智能技術項目),由美國總統(tǒng)唐納德·特朗普的一位年輕公開支持者創(chuàng)辦的科技公司悄悄贏得了一份相關的國防合同。
    VR
    Niantic正在開發(fā)一個世界規(guī)模的AR平臺,并旨在幫助AR開發(fā)者快速輕松地創(chuàng)建自己的游戲,無需面對一系列令人生畏的技術挑戰(zhàn)。Niantic Real World Platform是這家公司核理念的技術體現(xiàn):鍛煉,探索和社交互動...
    VR

    相關推薦

    1
    3
    主站蜘蛛池模板: 国产亚洲福利精品一区| 亚洲日韩精品一区二区三区| 在线精品亚洲一区二区三区| 亚洲大尺度无码无码专线一区 | 国产一区二区在线观看| 国产一区二区三区精品视频| 在线观看精品视频一区二区三区| 亚洲一区二区三区在线观看蜜桃 | 亚洲一区在线视频| 久久精品一区二区三区不卡| 国产在线精品一区二区| 精品久久久久久中文字幕一区| 精品无码国产一区二区三区AV| 日本不卡一区二区三区| 亚洲日韩精品一区二区三区| 中文字幕Av一区乱码| A国产一区二区免费入口| 一区二区三区视频免费观看 | 无码人妻精品一区二区三| 中日av乱码一区二区三区乱码| 国产日韩一区二区三免费高清 | 一区精品麻豆入口| 乱中年女人伦av一区二区| 丝袜美腿高跟呻吟高潮一区| 日本人的色道www免费一区| 国产拳头交一区二区| 一区二区三区电影网| 中文字幕人妻无码一区二区三区| 东京热无码一区二区三区av| 中文字幕在线观看一区| 国产精品熟女一区二区| 99久久综合狠狠综合久久一区| 亚洲av无码一区二区三区观看| 精品少妇人妻AV一区二区三区| 国模精品一区二区三区视频| 国产成人综合亚洲一区| 中文字幕一区二区免费| 亚洲国产一区二区三区青草影视| 亚洲狠狠狠一区二区三区| 深田咏美AV一区二区三区| 日韩精品一区二区三区在线观看|