谷歌新研究:讓失語者在視頻會議中自然使用手語

    VR/AR
    2020
    10/10
    14:34
    新浪VR
    分享
    評論

    來源:新浪VR

    視頻會議對所有人開放,那也應該包括使用手語進行交流的用戶,但由于大多數視頻會議系統會自動跟蹤講話人提示窗口,對于手語交流者而言,他們卻很難輕松有效地進行溝通。

    因此,在視頻會議中采用實時手語檢測的場景變得十分有挑戰性,系統需要使用大量視頻反饋作為輸入進行分類,這使得任務計算變得十分繁重。某種程度上,這些挑戰的存在也導致有關手語檢測的研究很少。

    近日在ECCV 2020和SLRTP 2020全球頂會上,谷歌的研究團隊提出了一個實時手語檢測模型,并詳述了該模型將如何用于視頻會議系統中識別“發言人”的過程。

    1、設計思路

    為了主動適配主流視頻會議系統所提供的會議解決方案,研究團隊采取了一種輕量型、即插即用的模型。該模型占用CPU小,以最大程度降低對客戶端通話質量的影響。為了減少輸入的維度,采用從視頻中分離所需信息,對每個幀進行分類。

    “由于手語涉及用戶的身體和手兩部分,我們先運行了人體姿態估計模型PoseNet,這樣可將輸入從整個高清圖像大幅分減到用戶身體上的一小部分,如眼睛、鼻子、肩膀、手等關鍵特征點(landmarks)。然后,我們再將這些關鍵特征點用于計算每一幀光流(Optical Flow),從而在不保留用戶特定信息的前提下就能量化用戶的姿態特征。每個姿態都通過人肩膀寬度進行歸一化,以確保模型在距離攝像頭一定距離內注意到用戶的手勢。最后,將光流通過視頻的幀速率進行歸一化,再傳遞給該模型。”

    為了測試這種方法的有效性,研究團隊采用了德語手語語料庫(DGS),該語料庫包含人體手勢的長視頻(含跨度注釋)。基于訓練好的線性回歸模型基線,使用光流數預測人體手勢何時發出。該模型基線可達到80%的準確度,每一幀僅需要約3μs(0.000003秒)的處理時間即可完成。通過將前50個幀的光流作為該模型的上下文,最終達到83.4%的準確度。

    團隊使用了長短期記憶網絡(LSTM)架構,該模型可實現的91.5%的準確度,每一幀的處理時間約為3.5毫秒(0.0035秒)。

    2、概念驗證

    在實際的場景中,有了運行完備的手語檢測模型僅是第一步,團隊還需要設計一種方法來出發視頻會議系統的主動式揚聲器功能。團隊開發了一款輕量級的在線手語檢測演示demo,可以連接到任何視頻會議系統上,并將手語交流者設置為“發言人”。

    當手勢檢測模型確定用戶正在進行手語交流時,它會通過虛擬音頻電纜傳遞超聲音頻,任何視頻會議系統都可檢測到該音頻,就好像手語交流者正在“講話”一樣。音頻以20kHz傳輸,通常在人類聽覺范圍之外。因為視頻會議系統通常將音頻的音量作為檢測是否正在講話的標準,而不是檢測語音,所以應用程序會誤以為手語交流者正在講話。

    目前這款模型的在線視頻演示源代碼已經公布在GitHub上。

    3、演示過程

    在視頻中,研究團隊演示了如何使用該模型。視頻中的黃色圖表反映了模型在檢測到手語交流時的確認值。當用戶使用手語時,圖表值將增加到接近100,當用戶停止使用手語時,圖表值將降低至0。

    為了進一步驗證該模型效果,團隊還進行了一項用戶體驗反饋調查。調研要求參與者在視頻會議期間使用該模型,并像往常一樣進行手語交流。他們還被要求互相使用手語,以檢測對說話人的切換功能。反饋結果是,該模型檢測到了手語,將其識別為可聽見的語音,并成功識別了手勢參與人。

    THE END
    廣告、內容合作請點擊這里 尋求合作
    VR
    免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

    相關熱點

    本月,微軟發布Surface的新品(全新配置Surface Pro X、全新的Surface Laptop Go)后,偷偷做了一個小調整,直接從官網上刪除了Surface Neo字樣,這也意味著這款產品被無限推遲。
    VR
    快充協議是充電器與設備溝通握手所需的“語言”,只有正確“對話”后,才可以“握手”成功,進行快速充電。我們一步一步來看不同的快充協議是怎樣工作的。
    VR
    近日,浙江省杭州市公安局反欺詐中心最新預警,“安全防護” APP 不安全。
    VR
    終于,有使用者正式在 Apple TV 4K 里看到 YouTube 4K 內容播放的選項,讓這款機頂盒變得更名符其實。
    VR
    對于自家的原生 Android 系統,Google 一直有利用快速更新、抓 bug 獎勵等手段來持續提升其安全性。
    VR

    相關推薦

    1
    3
    主站蜘蛛池模板: 少妇激情一区二区三区视频| 国产情侣一区二区| 色综合一区二区三区| 熟女少妇丰满一区二区| 在线成人综合色一区| 99精品一区二区免费视频 | 精品乱人伦一区二区| 夜色福利一区二区三区| 国产高清精品一区| 日韩av片无码一区二区不卡电影| 中文字幕精品无码一区二区三区| 波多野结衣一区在线| 日韩一区二区视频| 亚洲日本一区二区| 国产爆乳无码一区二区麻豆| 亚洲片国产一区一级在线观看| 午夜在线视频一区二区三区| 天堂国产一区二区三区| 国产成人无码一区二区在线观看| 日本在线观看一区二区三区| 无码喷水一区二区浪潮AV| 搡老熟女老女人一区二区| 国产AV一区二区三区传媒| 国产免费一区二区三区不卡| 中文字幕无线码一区| 一区二区在线播放视频| 波多野结衣中文一区| 国产一区二区三区免费视频| 在线成人综合色一区| 日本一区二区三区久久| 无码视频免费一区二三区| 国产乱码精品一区二区三区四川人| 91精品国产一区| 日韩中文字幕一区| 国产精品av一区二区三区不卡蜜| 精品视频无码一区二区三区| 亚洲视频免费一区| 交换国产精品视频一区| 国模无码一区二区三区| 成人精品视频一区二区| 内射白浆一区二区在线观看|