久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

回顧微軟30年沉浸式3D音頻、聲學領域的研究歷程

VR/AR
2020
08/19
21:11
映維網
分享
評論

來源:映維網 作者 顏昳華

對于自然用戶界面,游戲,虛擬現實和混合現實,以及普適計算(ubiquitous computing)而言,獲取正確的聲音是一個關鍵因素。音頻在盲人或低視力人群的輔助技術中同樣扮演著重要的角色。盡管過去數十年間的計算機已經能夠播放和處理高保真音頻,但語言或沉浸式聲場的計算識別、分析和渲染方面依然存在一系列有待探索的前言。

自微軟研究院于1991年成立以來,音頻一直是團隊重要的研究領域。在成立的第一年里,研究人員就利用音頻數據和其他線索探索視聽演示文稿的自動摘要。

多年來,微軟研究院在語音識別、自然用戶界面、捕捉和再現聲音、空間音頻、聲學模擬和音頻分析等方面都取得了穩定而顯著的進展,而且大部分都有應用于諸如Windows10、Kinect、HoloLens和Teams的微軟產品和服務,以及福特的同步車載信息娛樂系統,Polycom的視頻會議設備,諸如《戰爭機器》和《盜賊之?!返扔螒颉?/p>

在下面的時間線里,微軟將與我們回顧團隊在音頻和聲學研究方面的歷史進程:

1. 語言識別和自然用戶界面

2002年:微軟的研究人員建立了“Sound Capture and Speech Enhancement/聲音捕捉和語音增強”項目,并開始始探索諸如減少回聲、麥克風陣列處理和降噪等領域。

相關論文:Gain Self-Calibration Procedure for Microphone Arrays

相關論文:A New Beamformer Design Algorithm for Microphone Arrays

相關論文:Reverberation Reduction for Better Speech Recognition

相關論文:Microphone Array Post-Processor Using Instantaneous Direction of Arrival

2007年:福特發布了第一個版本的車內信息娛樂系統SYNC,其中語音增強音頻管道最初是由微軟的研究人員設計。

相關視頻:Natural Language Moves In-Car Infotainment Forward

相關論文:Unified Framework for Single Channel Speech Enhancement

2007年:Windows增加對麥克風陣列的支持。微軟發布了WindowsVista,包括對四種預選麥克風陣列幾何結構的支持,以及對USB麥克風陣列的標準化支持。之后,Windows 10已經能夠支持任意幾何形狀的麥克風陣列。

相關論文:Sound Capture and Processing: Practical Approaches

2010年:微軟為Xbox360發布了Kinect,其中包括首個免手操作開放式麥克風命令和帶有環繞聲回音消除功能的控制產品。

相關論文:Beamformer Design Using Measured Microphone Directivity Patterns: Robustness to Modelling Error

相關論文:Optimal 3D Beamforming Using Measured Microphone Directivity Patterns

相關論文:Data Driven Suppression Rule for Speech Enhancement

相關論文:Kinect Development Kit: A Toolkit for Gesture- and Speech-Based Human-Machine Interaction

2016年:微軟在這一年發布了HoloLens,它包含一個四元麥克風陣列和一個復雜的聲音捕捉和語音增強系統,可用于捕捉用戶的聲音和周圍的環境聲音。

2017年:研究人員開始探索用于語音增強的神經網絡。微軟在這一年建立了“Neural Networks-Based Speech Enhancement/基于神經網絡的語音增強”項目,并旨在實現更精確、更可靠的語音處理,尤其是在移動設備、可穿戴設備、智能家居和物聯網設備。與以前的設備不同,所述設備帶來了全新的挑戰,如噪音更大的背景環境,更大的揚聲器與麥克風距離,以及有限的邊緣處理能力。

相關論文:A Causal Speech Enhancement Approach Combining Data-driven Learning and Suppression Rule Estimation

相關論文:A Hybrid Approach to Combining Conventional and Deep Learning Techniques for Single-channel Speech Enhancement and Recognition

相關論文:Convolutional-Recurrent Neural Networks for Speech Enhancement

相關論文:Constrained Convolutional-recurrent Networks to Improve Speech Quality with Low Impact on Recognition Accuracy

相關論文:Limiting Numerical Precision of Neural Networks to Achieve Real-time Voice Activity Detection

2019年:微軟發布HoloLens 2。這款設備包含一個五元麥克風陣列和復雜的聲音捕捉和語音增強系統。同時,研究人員在2020年初開始探索其語音增強技術的關鍵組件。

相關論文:Weighted Speech Distortion Losses for Neural-Network-Based Real-Time Speech Enhancement

相關論文:Acoustic Localization using Spatial Probability in Noisy and Reverberant Environments

2020年:Microfoft Teams的語音增強。微軟首席執行官薩蒂亞·納德拉(Satya Nadell)在這一年宣布,Microfoft Teams的優化將包括基于神經網絡的語音增強算法。

2. 支持協作和生產力的音頻

1991年:微軟的研究人員發表了第一篇與音頻相關的論文,其主要是關于多媒體演示文稿的自動摘要。

相關論文:Auto-Summarization of Audio-Video Presentations

1996年:微軟的研究人員探索了在交互式環境中使用視覺數據捕捉和渲染聲音的方法。

相關論文:Vision-Steered Audio for Interactive Environments

1999年:在這一年里,微軟團隊在音頻檢測和分類方面取得了長足的進步。

相關論文:Detection of target speakers in audio databases

相關論文:A Robust Audio Classification and Segmentation Method

2001年:微軟在這一年建立了RingCam項目,并旨在探索360度視頻會議。

相關論文:Distributed Meetings: A Meeting Capture and Broadcasting System

2007年:微軟RoundTable在這一年提供了揚聲器檢測技術,由微軟研究人員開發的言語檢測技術成為了微軟RoundTable系統的一部分。這項技術后來賣給了Polycom,并作為Polycom CX5000的一部分發布。

3. 捕捉和再現聲音

1998年:微軟研究人員開始試驗麥克風陣列,他們建造了第一個麥克風陣列。

2005年:微軟的研究人員建立了“Audio Devices /音頻設備”項目,并構建和評估了兩個USB麥克風陣列原型:一個四元線性陣列和一個八元圓形陣列。

2007年:微軟雷德蒙德研究中心搬進了Building 99的新家。這個建筑包括公司的第一個消聲室。

相關論文:Robust Design of Wideband Loudspeaker Arrays

相關論文:Sound Capture System and Spatial Filter for Small Devices

2009年:團隊對Building 99的消聲室進行了改造,使其可以自動測量3D方向性和輻射模式,包括人類的空間聽覺。它使用亞毫米精度的三維掃描儀測量頭部和軀干。除此之外,這使得能夠實現更逼真空間音頻的頭相關傳遞函數(HRTFs)的開發成為可能。

2012年:為了使用球形和圓柱形函數來研究聲場,微軟研究人員建立了一個16通道球形麥克風陣列和一個16通道圓柱形麥克風陣列。值得一提的是,團隊在2016年構建了一個64通道球形麥克風陣列。

2017年:微軟研究人員提出了一種使用超聲波來進行手勢識別的新方法。這種方法的功耗顯著低于光學系統。

相關論文:Ultrasound-based Gesture Recognition

相關論文:Hardware and Algorithms for Ultrasonic Depth Imaging

相關論文:Multimodal Gesture Recognition

2018年:微軟研究人員開始探索實況360度音頻和視頻流式傳輸。

相關視頻:Live 360 audio and video streaming

2019年:微軟的研究人員建立了Denmark項目,其旨在利用由諸如智能手機和筆記本電腦等普通消費者設備成的虛擬麥克風陣列來實現會議對話的高質量捕捉。

4. 空間音頻

2012年:微軟的研究人員開始探索空間音頻的新方向,開始研究與頭相關傳遞函數(HRTFs)的新方法。這項工作的一個潛在成果是實現更為真實的空間音頻。

相關論文:HRTF Magnitude Modeling Using a Non-Regularized Least-Squares Fit of Spherical Harmonics Coefficients on Incomplete Data

相關論文:HRTF Magnitude Synthesis via Sparse Representation of Anthropometric Features

相關論文:HRTF Phase Synthesis via Sparse Representation of Anthropometric Features

相關博文:Microsoft 3D audio tech makes virtual sounds sound real

相關視頻:3-D Audio Demo

2015年:微軟發布了支持虛擬環繞聲的Windows 10:Windows Sonic。這個空間音頻渲染系統后來集成到HoloLens之中。

相關論文:Estimation of Multipath Propagation Delays and Interaural Time Differences from 3-D Head Scans

相關論文:Applications of 3D Spherical Transforms To Personalization Of Head-Related Transfer Functions

2016年:微軟發布了HoloLens。這個設備配備了一個音頻渲染系統,可對用戶的空間聽覺進行動態個性化設置。

2016年:微軟發布Windows Mixed Reality平臺。Windows10支持其他公司生產的虛擬現實頭顯和混合現實頭顯。這個平臺包含空間音頻引擎的擴展和改進版本。

相關論文:Head-related transfer function personalization for the needs of spatial audio in mixed and virtual reality

2017年:微軟發布了Soundscape(與Guide Dogs U合作),這是一個針對視力受損人群的輔助應用程序,其包括一個空間音頻渲染系統。

相關論文:Blind reverberation time estimation using a convolutional neural network

相關項目:Project Soundscape

相關視頻:Microsoft Soundscape: A Map Delivered in 3D Sound

2018年:Ivan Tashev博士通過播客概述了對更好的聲音處理和語音增強技術的追求,并描述了3D音頻的最新創新。他同時解釋了為什么由于人類感知能力的變化,音頻處理技術背后的研究是科學、藝術和工藝的平衡整合。

相關播客:Podcast: Hearing in 3D with Dr. Ivan Tashev

2018年:微軟研究團隊在這一年發布了一系列的重要論文。

相關論文:A Sparsity Measure for Echo Density Growth in General Environments

相關論文:Blind Room Volume Estimation from Single-channel Noisy Speech

相關論文:Capture, representation, and rendering of 3D audio for virtual and augmented reality

相關論文:Improving Binaural Ambisonics Decoding by Spherical Harmonics Domain Tapering and Coloration Compensation

相關論文:Spectral manipulation improves elevation perception with non-individualized head-related transfer functions

5. 聲學模擬

2010年:在2010年之前,交互式音頻的一個關鍵挑戰是在復雜的游戲場景中快速建模波浪效果。在2010年,微軟的研究人員提出了預先計算物理精確的波形模擬的概念,并證明這是交互式音頻和游戲的可行途徑。

Triton項目探索了一種基于物理的虛擬環境建模方法,其旨在實現更為真實的游戲內音頻。

相關論文:Precomputed Wave Simulation for Real-Time Sound Propagation of Dynamic Sources in Complex Scenes

相關項目:Project Triton

2012年:微軟研究人員開始與游戲工作室合作。如與The Coalition Studio 合作,并將上述的聲學模擬研究納入《戰爭機器》。通過這樣的方式,團隊開始從探索性研究過渡到注重性能和靈活性的重新設計。

2013年:Project Triton的首個工作原型在內部演示。

2014年:團隊發布了一份描述了Triton項目的核心設計的論文,以及如何將感知編碼、空間壓縮和參數化繪制相結合。所述設計解決了系統資源的使用問題,并能方便地集成到現有的音頻工具中。后來的研究正是建立在這個核心設計之上,并進行了各種改進。

相關論文:Parametric Wave Field Coding for Precomputed Sound Propagation

2015年:微軟研究院的暑期實習生研究了一種新的自適應采樣方法,并旨在解決Triton項目中的一個關鍵魯棒性問題。

相關論文:Adaptive Sampling For Sound Propagation

2016年:Project Triton成為《戰爭機器4》的一部分。這是由精確基物模擬提供的首個游戲聲學實例。

相關視頻:GDC 2017 talk on Gears of War integration

2017年:Project Triton開始支持混合現實體驗,并作為Windows10 Fall Creator更新的一部分。它在“懸崖屋”空間中提供了一種自然的聲學體驗,包含新的定向聲學特性。這一體驗同時結合了前面所述的HRTFs進步。

2018年,Project Triton成為《盜賊之?!返囊徊糠?,這是第二款采用這項技術的游戲。

相關論文:Parametric Directional Coding for Precomputed Sound Propagation

2019年:Nikunj Raghuvanshi博士通過播客介紹了聲音是如何傳播,以及Project Triton的相關事項。

相關播客:Podcast: Project Triton and the Physics of Sound with Dr. Nikunj Raghuvanshi

2019年:Project Triton作為Project Acoustics向所有開發者開放,其包括Unity和Unreal插件,以便開發者輕松將其集成到游戲和研究原型中。

相關視頻:Project Acoustics: Making Waves with Triton

相關視頻:Project Acoustics | Game Developers Conference 2019

2019年:《無主之地 3》發行。這是微軟之外第一家使用Project Triton的游戲工作室。

2020年:Project Triton集成到HoloLens。這一里程碑標志著物理聲學在增強現實中的首次演示。

相關視頻:Using Project Acoustics with HoloLens 2

相關論文:Cloud-Enabled Interactive Sound Propagation for Untethered Mixed Reality

2020年:微軟首席研究員Nikunj Raghuvanshi博士在網絡研討會中介紹了創建實用、高質量聲音模擬的來龍去脈。它包括聲音模擬的三個組成部分:合成、傳播和空間化。對于每一個問題,他將回顧基礎物理,研究技術,實際考慮,和開放的研究問題。

相關視頻:Interactive Sound Simulation:Rendering immersive soundscapes in games and virtual reality

6. 音頻分析

2010年:微軟研究人員建立了“Audio Analytics/音頻分析”項目,并旨在探索從人類語音中提取非語言線索,檢測特定的音頻事件和背景噪聲,以及音頻搜索和檢索等主題。這項技術的潛在應用包括客服電話的客戶滿意度分析、媒體內容分析和檢索、醫療診斷輔助設備和患者監控、聽力障礙患者輔助技術以及公共安全音頻分析等等。

相關論文:A New Speaker Identification Algorithm for Gaming Scenarios

相關論文:Speech Emotion Recognition Using Deep Neural Network and Extreme Learning Machine

相關論文:High-level Feature Representation using Recurrent Neural Network for Speech Emotion Recognition

2015年:“Hey, Cortana”支持人話識別。微軟發布了包含揚聲器識別功能的Windows10,并將其作為“Hey, Cortana”喚醒功能的一部分。

相關論文:Learning Utterance-level Representations for Speech Emotion and Age/Gender Recognition Using Deep Neural Networks

相關論文:A Cross-modal Audio Search Engine based on Joint Audio-Text Embeddings

相關論文:Supervised Deep Hashing for Efficient Audio Event Retrieval

原文鏈接:https://yivian.com/news/77116.html

THE END
廣告、內容合作請點擊這里 尋求合作
VR
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

Unity MARS的Simulation(模擬)系統減少了AR應用程序開發的測試時間,因為它能夠直接通過Unity Editor的Play Mode和Edit Mode提供諸如平面和圖像標記檢測等世界理解能力。
VR
Steam每周都會公布一個TOP10暢銷榜,而這個暢銷榜TOP10是根據銷售總收入排名,這也使得Valve的VR頭顯Valve Index能屢屢擠入這個暢銷榜內。但在上周的名單中,Valve Index跌出Steam每周暢銷榜TOP10,這是Va...
VR
對于沉浸式內容,在AR和VR中創建數字化身是一個需求,但同時是一個技術挑戰。對于初學者來說,這或許比在3D中創建對象和環境要困難得多。
VR
盛夏8月,一場屬于AR/VR行業的盛會——AWE(Augmented World Expo)增強現實世界博覽會在深圳成功舉行。AWE聚焦全球最前沿的AR/VR技術、匯集AR/VR行業最高端人才,與會的行業內佼佼者們紛紛展示各家研發新...
VR
上周8月14日,因為Epic Games在游戲《堡壘之夜》增加了一種可繞開蘋果和谷歌支付系統以規避30%抽成的新內購機制,蘋果和谷歌相繼下架《堡壘之夜》。Epic Games于是就壟斷問題起訴了這家平臺巨頭,并且發起...
VR

相關推薦

1
3
久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

    9000px;">

      91黄色免费看| 久久成人av少妇免费| 蜜臀国产一区二区三区在线播放| 国产日韩v精品一区二区| 亚洲一区二区精品3399| 91影院在线观看| 欧美高清一级片在线观看| 韩国欧美一区二区| 精品剧情在线观看| 国产成人亚洲精品青草天美| 精品久久久久久久久久久院品网| 午夜精品久久久| 欧美极品aⅴ影院| 亚洲嫩草精品久久| 亚洲 欧美综合在线网络| 国产精品沙发午睡系列990531| 不卡的av中国片| 3atv一区二区三区| 色88888久久久久久影院按摩| 日韩精品一区二区三区在线观看| 日韩理论电影院| 国产在线播放一区二区三区| 在线观看亚洲精品| 日韩精品一区二区三区视频| 国产精品一品视频| 91麻豆精品91久久久久久清纯 | 国模一区二区三区白浆| 色先锋aa成人| 亚洲精品久久嫩草网站秘色| 黑人巨大精品欧美黑白配亚洲| 7777女厕盗摄久久久| 色88888久久久久久影院野外| 日韩网站在线看片你懂的| 亚洲美女视频在线观看| 国产成人免费在线视频| 欧美大胆人体bbbb| 国产99精品国产| 亚洲精品乱码久久久久久| 99久久精品国产观看| 亚洲成人av资源| 91精选在线观看| 国产乱对白刺激视频不卡| 中文字幕第一页久久| 欧美日韩国产综合视频在线观看| 麻豆精品国产传媒mv男同| 日韩三级在线观看| 亚洲综合精品久久| 久久蜜桃av一区精品变态类天堂| 在线综合+亚洲+欧美中文字幕| 国产一区91精品张津瑜| 成人激情动漫在线观看| 日本道免费精品一区二区三区| 日韩一区二区三区在线| 亚洲欧洲精品成人久久奇米网| 一区二区三区高清| 成人免费毛片嘿嘿连载视频| 国产亚洲污的网站| 国产成人精品一区二区三区四区| 国产亚洲一区二区三区四区 | 91福利在线免费观看| 亚洲欧洲成人自拍| 91蝌蚪porny| 中文字幕欧美一| 一本大道久久精品懂色aⅴ| 日韩欧美另类在线| 91精品国产综合久久久蜜臀粉嫩| 夜夜揉揉日日人人青青一国产精品| 欧美在线视频全部完| 亚洲18女电影在线观看| 精品粉嫩超白一线天av| 亚洲手机成人高清视频| 制服丝袜中文字幕一区| 56国语精品自产拍在线观看| 久久99国产精品久久| 欧美激情中文字幕一区二区| 在线亚洲人成电影网站色www| 国产精品美女久久久久久| 成人a免费在线看| 久久不见久久见免费视频7 | 国产日产欧产精品推荐色| 欧美一级久久久久久久大片| 色综合久久天天| 一本大道av一区二区在线播放| 在线观看国产91| 91精品免费在线| 国产精品欧美久久久久无广告| 亚洲视频一区二区在线| 视频在线在亚洲| 日韩欧美电影在线| 91丝袜国产在线播放| 国产精品久久精品日日| 色哟哟精品一区| 另类欧美日韩国产在线| 91久久精品一区二区三区| 亚洲bt欧美bt精品| 国产一区二区三区美女| 中文字幕日韩av资源站| 欧美日本高清视频在线观看| 成人午夜短视频| 国产精品视频线看| 日韩免费看网站| 韩国一区二区三区| 视频在线观看91| 91精品黄色片免费大全| 国产成人av电影在线观看| 国产成a人亚洲| 欧美精品在线观看一区二区| 欧美激情在线看| 国产精品美女久久久久久久网站| 蜜桃精品视频在线观看| 色婷婷国产精品久久包臀| 国产精品福利一区二区三区| 久久毛片高清国产| 亚洲黄色av一区| 国产精品亚洲人在线观看| 色哟哟一区二区在线观看| 精品播放一区二区| 久久精品国产精品亚洲综合| 欧美日韩一区二区三区四区五区| 国产精品乱人伦| 国产九色sp调教91| 国产欧美精品一区二区色综合| 精品一区二区综合| 欧美成人一区二区三区片免费| 中文字幕一区二区三| 国产一区二区在线影院| 91精品国产综合久久小美女| 一区二区三区在线免费视频| 亚洲欧洲性图库| 狠狠色狠狠色合久久伊人| 不卡影院免费观看| 欧美人xxxx| 日本一区二区三区久久久久久久久不 | 99国产精品99久久久久久| 国产一区视频在线看| 午夜久久久久久久久| 国产大片一区二区| 国产精品美女久久久久久2018| 国产欧美日韩不卡免费| 国产成人鲁色资源国产91色综| 久久久精品免费免费| 成人午夜在线播放| 亚洲乱码中文字幕综合| 一区二区三区在线免费| 欧美中文字幕一区| 国产自产2019最新不卡| 99精品国产91久久久久久 | 亚洲高清视频的网址| 欧美日韩国产一级| 国产高清久久久久| 亚洲综合免费观看高清完整版在线 | av网站一区二区三区| 亚洲黄色录像片| 欧美激情在线一区二区三区| 欧美日韩一区二区三区高清| 亚洲欧美日韩中文字幕一区二区三区| 色国产精品一区在线观看| 亚洲精品中文字幕在线观看| 色久综合一二码| 国产亚洲一区二区三区四区| 亚洲成人一二三| 色婷婷久久久综合中文字幕| 日韩精品视频网| 亚洲一区二区三区精品在线| 免费成人性网站| 精品成a人在线观看| 久久精品二区亚洲w码| 亚洲图片激情小说| 男人的j进女人的j一区| 久久www免费人成看片高清| 国产成人亚洲综合色影视| 成人午夜激情视频| 在线不卡中文字幕播放| 26uuu欧美| 亚洲午夜精品在线| 精品亚洲国产成人av制服丝袜| 欧美高清视频一二三区| 色视频成人在线观看免| 国产成人精品综合在线观看 | 激情欧美一区二区| 日韩电影在线免费观看| 亚洲人123区| 一区二区三区四区乱视频| 日韩欧美不卡一区| 国产三级精品三级在线专区| 中文字幕国产一区二区| 亚洲国产成人午夜在线一区| 国产免费成人在线视频| 亚洲综合在线视频| 久久精品二区亚洲w码| 亚洲观看高清完整版在线观看| 国产电影一区二区三区| 91猫先生在线| 欧美激情一区二区三区蜜桃视频| 亚洲男人电影天堂| 免费在线看成人av| 视频一区二区国产| 欧美精品欧美精品系列| 欧美电影免费提供在线观看| 国产精品电影院|