久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

回顧微軟30年沉浸式3D音頻、聲學領域的研究歷程

VR/AR
2020
08/19
21:11
映維網
分享
評論

來源:映維網 作者 顏昳華

對于自然用戶界面,游戲,虛擬現實和混合現實,以及普適計算(ubiquitous computing)而言,獲取正確的聲音是一個關鍵因素。音頻在盲人或低視力人群的輔助技術中同樣扮演著重要的角色。盡管過去數十年間的計算機已經能夠播放和處理高保真音頻,但語言或沉浸式聲場的計算識別、分析和渲染方面依然存在一系列有待探索的前言。

自微軟研究院于1991年成立以來,音頻一直是團隊重要的研究領域。在成立的第一年里,研究人員就利用音頻數據和其他線索探索視聽演示文稿的自動摘要。

多年來,微軟研究院在語音識別、自然用戶界面、捕捉和再現聲音、空間音頻、聲學模擬和音頻分析等方面都取得了穩定而顯著的進展,而且大部分都有應用于諸如Windows10、Kinect、HoloLens和Teams的微軟產品和服務,以及福特的同步車載信息娛樂系統,Polycom的視頻會議設備,諸如《戰爭機器》和《盜賊之?!返扔螒颉?/p>

在下面的時間線里,微軟將與我們回顧團隊在音頻和聲學研究方面的歷史進程:

1. 語言識別和自然用戶界面

2002年:微軟的研究人員建立了“Sound Capture and Speech Enhancement/聲音捕捉和語音增強”項目,并開始始探索諸如減少回聲、麥克風陣列處理和降噪等領域。

相關論文:Gain Self-Calibration Procedure for Microphone Arrays

相關論文:A New Beamformer Design Algorithm for Microphone Arrays

相關論文:Reverberation Reduction for Better Speech Recognition

相關論文:Microphone Array Post-Processor Using Instantaneous Direction of Arrival

2007年:福特發布了第一個版本的車內信息娛樂系統SYNC,其中語音增強音頻管道最初是由微軟的研究人員設計。

相關視頻:Natural Language Moves In-Car Infotainment Forward

相關論文:Unified Framework for Single Channel Speech Enhancement

2007年:Windows增加對麥克風陣列的支持。微軟發布了WindowsVista,包括對四種預選麥克風陣列幾何結構的支持,以及對USB麥克風陣列的標準化支持。之后,Windows 10已經能夠支持任意幾何形狀的麥克風陣列。

相關論文:Sound Capture and Processing: Practical Approaches

2010年:微軟為Xbox360發布了Kinect,其中包括首個免手操作開放式麥克風命令和帶有環繞聲回音消除功能的控制產品。

相關論文:Beamformer Design Using Measured Microphone Directivity Patterns: Robustness to Modelling Error

相關論文:Optimal 3D Beamforming Using Measured Microphone Directivity Patterns

相關論文:Data Driven Suppression Rule for Speech Enhancement

相關論文:Kinect Development Kit: A Toolkit for Gesture- and Speech-Based Human-Machine Interaction

2016年:微軟在這一年發布了HoloLens,它包含一個四元麥克風陣列和一個復雜的聲音捕捉和語音增強系統,可用于捕捉用戶的聲音和周圍的環境聲音。

2017年:研究人員開始探索用于語音增強的神經網絡。微軟在這一年建立了“Neural Networks-Based Speech Enhancement/基于神經網絡的語音增強”項目,并旨在實現更精確、更可靠的語音處理,尤其是在移動設備、可穿戴設備、智能家居和物聯網設備。與以前的設備不同,所述設備帶來了全新的挑戰,如噪音更大的背景環境,更大的揚聲器與麥克風距離,以及有限的邊緣處理能力。

相關論文:A Causal Speech Enhancement Approach Combining Data-driven Learning and Suppression Rule Estimation

相關論文:A Hybrid Approach to Combining Conventional and Deep Learning Techniques for Single-channel Speech Enhancement and Recognition

相關論文:Convolutional-Recurrent Neural Networks for Speech Enhancement

相關論文:Constrained Convolutional-recurrent Networks to Improve Speech Quality with Low Impact on Recognition Accuracy

相關論文:Limiting Numerical Precision of Neural Networks to Achieve Real-time Voice Activity Detection

2019年:微軟發布HoloLens 2。這款設備包含一個五元麥克風陣列和復雜的聲音捕捉和語音增強系統。同時,研究人員在2020年初開始探索其語音增強技術的關鍵組件。

相關論文:Weighted Speech Distortion Losses for Neural-Network-Based Real-Time Speech Enhancement

相關論文:Acoustic Localization using Spatial Probability in Noisy and Reverberant Environments

2020年:Microfoft Teams的語音增強。微軟首席執行官薩蒂亞·納德拉(Satya Nadell)在這一年宣布,Microfoft Teams的優化將包括基于神經網絡的語音增強算法。

2. 支持協作和生產力的音頻

1991年:微軟的研究人員發表了第一篇與音頻相關的論文,其主要是關于多媒體演示文稿的自動摘要。

相關論文:Auto-Summarization of Audio-Video Presentations

1996年:微軟的研究人員探索了在交互式環境中使用視覺數據捕捉和渲染聲音的方法。

相關論文:Vision-Steered Audio for Interactive Environments

1999年:在這一年里,微軟團隊在音頻檢測和分類方面取得了長足的進步。

相關論文:Detection of target speakers in audio databases

相關論文:A Robust Audio Classification and Segmentation Method

2001年:微軟在這一年建立了RingCam項目,并旨在探索360度視頻會議。

相關論文:Distributed Meetings: A Meeting Capture and Broadcasting System

2007年:微軟RoundTable在這一年提供了揚聲器檢測技術,由微軟研究人員開發的言語檢測技術成為了微軟RoundTable系統的一部分。這項技術后來賣給了Polycom,并作為Polycom CX5000的一部分發布。

3. 捕捉和再現聲音

1998年:微軟研究人員開始試驗麥克風陣列,他們建造了第一個麥克風陣列。

2005年:微軟的研究人員建立了“Audio Devices /音頻設備”項目,并構建和評估了兩個USB麥克風陣列原型:一個四元線性陣列和一個八元圓形陣列。

2007年:微軟雷德蒙德研究中心搬進了Building 99的新家。這個建筑包括公司的第一個消聲室。

相關論文:Robust Design of Wideband Loudspeaker Arrays

相關論文:Sound Capture System and Spatial Filter for Small Devices

2009年:團隊對Building 99的消聲室進行了改造,使其可以自動測量3D方向性和輻射模式,包括人類的空間聽覺。它使用亞毫米精度的三維掃描儀測量頭部和軀干。除此之外,這使得能夠實現更逼真空間音頻的頭相關傳遞函數(HRTFs)的開發成為可能。

2012年:為了使用球形和圓柱形函數來研究聲場,微軟研究人員建立了一個16通道球形麥克風陣列和一個16通道圓柱形麥克風陣列。值得一提的是,團隊在2016年構建了一個64通道球形麥克風陣列。

2017年:微軟研究人員提出了一種使用超聲波來進行手勢識別的新方法。這種方法的功耗顯著低于光學系統。

相關論文:Ultrasound-based Gesture Recognition

相關論文:Hardware and Algorithms for Ultrasonic Depth Imaging

相關論文:Multimodal Gesture Recognition

2018年:微軟研究人員開始探索實況360度音頻和視頻流式傳輸。

相關視頻:Live 360 audio and video streaming

2019年:微軟的研究人員建立了Denmark項目,其旨在利用由諸如智能手機和筆記本電腦等普通消費者設備成的虛擬麥克風陣列來實現會議對話的高質量捕捉。

4. 空間音頻

2012年:微軟的研究人員開始探索空間音頻的新方向,開始研究與頭相關傳遞函數(HRTFs)的新方法。這項工作的一個潛在成果是實現更為真實的空間音頻。

相關論文:HRTF Magnitude Modeling Using a Non-Regularized Least-Squares Fit of Spherical Harmonics Coefficients on Incomplete Data

相關論文:HRTF Magnitude Synthesis via Sparse Representation of Anthropometric Features

相關論文:HRTF Phase Synthesis via Sparse Representation of Anthropometric Features

相關博文:Microsoft 3D audio tech makes virtual sounds sound real

相關視頻:3-D Audio Demo

2015年:微軟發布了支持虛擬環繞聲的Windows 10:Windows Sonic。這個空間音頻渲染系統后來集成到HoloLens之中。

相關論文:Estimation of Multipath Propagation Delays and Interaural Time Differences from 3-D Head Scans

相關論文:Applications of 3D Spherical Transforms To Personalization Of Head-Related Transfer Functions

2016年:微軟發布了HoloLens。這個設備配備了一個音頻渲染系統,可對用戶的空間聽覺進行動態個性化設置。

2016年:微軟發布Windows Mixed Reality平臺。Windows10支持其他公司生產的虛擬現實頭顯和混合現實頭顯。這個平臺包含空間音頻引擎的擴展和改進版本。

相關論文:Head-related transfer function personalization for the needs of spatial audio in mixed and virtual reality

2017年:微軟發布了Soundscape(與Guide Dogs U合作),這是一個針對視力受損人群的輔助應用程序,其包括一個空間音頻渲染系統。

相關論文:Blind reverberation time estimation using a convolutional neural network

相關項目:Project Soundscape

相關視頻:Microsoft Soundscape: A Map Delivered in 3D Sound

2018年:Ivan Tashev博士通過播客概述了對更好的聲音處理和語音增強技術的追求,并描述了3D音頻的最新創新。他同時解釋了為什么由于人類感知能力的變化,音頻處理技術背后的研究是科學、藝術和工藝的平衡整合。

相關播客:Podcast: Hearing in 3D with Dr. Ivan Tashev

2018年:微軟研究團隊在這一年發布了一系列的重要論文。

相關論文:A Sparsity Measure for Echo Density Growth in General Environments

相關論文:Blind Room Volume Estimation from Single-channel Noisy Speech

相關論文:Capture, representation, and rendering of 3D audio for virtual and augmented reality

相關論文:Improving Binaural Ambisonics Decoding by Spherical Harmonics Domain Tapering and Coloration Compensation

相關論文:Spectral manipulation improves elevation perception with non-individualized head-related transfer functions

5. 聲學模擬

2010年:在2010年之前,交互式音頻的一個關鍵挑戰是在復雜的游戲場景中快速建模波浪效果。在2010年,微軟的研究人員提出了預先計算物理精確的波形模擬的概念,并證明這是交互式音頻和游戲的可行途徑。

Triton項目探索了一種基于物理的虛擬環境建模方法,其旨在實現更為真實的游戲內音頻。

相關論文:Precomputed Wave Simulation for Real-Time Sound Propagation of Dynamic Sources in Complex Scenes

相關項目:Project Triton

2012年:微軟研究人員開始與游戲工作室合作。如與The Coalition Studio 合作,并將上述的聲學模擬研究納入《戰爭機器》。通過這樣的方式,團隊開始從探索性研究過渡到注重性能和靈活性的重新設計。

2013年:Project Triton的首個工作原型在內部演示。

2014年:團隊發布了一份描述了Triton項目的核心設計的論文,以及如何將感知編碼、空間壓縮和參數化繪制相結合。所述設計解決了系統資源的使用問題,并能方便地集成到現有的音頻工具中。后來的研究正是建立在這個核心設計之上,并進行了各種改進。

相關論文:Parametric Wave Field Coding for Precomputed Sound Propagation

2015年:微軟研究院的暑期實習生研究了一種新的自適應采樣方法,并旨在解決Triton項目中的一個關鍵魯棒性問題。

相關論文:Adaptive Sampling For Sound Propagation

2016年:Project Triton成為《戰爭機器4》的一部分。這是由精確基物模擬提供的首個游戲聲學實例。

相關視頻:GDC 2017 talk on Gears of War integration

2017年:Project Triton開始支持混合現實體驗,并作為Windows10 Fall Creator更新的一部分。它在“懸崖屋”空間中提供了一種自然的聲學體驗,包含新的定向聲學特性。這一體驗同時結合了前面所述的HRTFs進步。

2018年,Project Triton成為《盜賊之海》的一部分,這是第二款采用這項技術的游戲。

相關論文:Parametric Directional Coding for Precomputed Sound Propagation

2019年:Nikunj Raghuvanshi博士通過播客介紹了聲音是如何傳播,以及Project Triton的相關事項。

相關播客:Podcast: Project Triton and the Physics of Sound with Dr. Nikunj Raghuvanshi

2019年:Project Triton作為Project Acoustics向所有開發者開放,其包括Unity和Unreal插件,以便開發者輕松將其集成到游戲和研究原型中。

相關視頻:Project Acoustics: Making Waves with Triton

相關視頻:Project Acoustics | Game Developers Conference 2019

2019年:《無主之地 3》發行。這是微軟之外第一家使用Project Triton的游戲工作室。

2020年:Project Triton集成到HoloLens。這一里程碑標志著物理聲學在增強現實中的首次演示。

相關視頻:Using Project Acoustics with HoloLens 2

相關論文:Cloud-Enabled Interactive Sound Propagation for Untethered Mixed Reality

2020年:微軟首席研究員Nikunj Raghuvanshi博士在網絡研討會中介紹了創建實用、高質量聲音模擬的來龍去脈。它包括聲音模擬的三個組成部分:合成、傳播和空間化。對于每一個問題,他將回顧基礎物理,研究技術,實際考慮,和開放的研究問題。

相關視頻:Interactive Sound Simulation:Rendering immersive soundscapes in games and virtual reality

6. 音頻分析

2010年:微軟研究人員建立了“Audio Analytics/音頻分析”項目,并旨在探索從人類語音中提取非語言線索,檢測特定的音頻事件和背景噪聲,以及音頻搜索和檢索等主題。這項技術的潛在應用包括客服電話的客戶滿意度分析、媒體內容分析和檢索、醫療診斷輔助設備和患者監控、聽力障礙患者輔助技術以及公共安全音頻分析等等。

相關論文:A New Speaker Identification Algorithm for Gaming Scenarios

相關論文:Speech Emotion Recognition Using Deep Neural Network and Extreme Learning Machine

相關論文:High-level Feature Representation using Recurrent Neural Network for Speech Emotion Recognition

2015年:“Hey, Cortana”支持人話識別。微軟發布了包含揚聲器識別功能的Windows10,并將其作為“Hey, Cortana”喚醒功能的一部分。

相關論文:Learning Utterance-level Representations for Speech Emotion and Age/Gender Recognition Using Deep Neural Networks

相關論文:A Cross-modal Audio Search Engine based on Joint Audio-Text Embeddings

相關論文:Supervised Deep Hashing for Efficient Audio Event Retrieval

原文鏈接:https://yivian.com/news/77116.html

THE END
廣告、內容合作請點擊這里 尋求合作
VR
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

Unity MARS的Simulation(模擬)系統減少了AR應用程序開發的測試時間,因為它能夠直接通過Unity Editor的Play Mode和Edit Mode提供諸如平面和圖像標記檢測等世界理解能力。
VR
Steam每周都會公布一個TOP10暢銷榜,而這個暢銷榜TOP10是根據銷售總收入排名,這也使得Valve的VR頭顯Valve Index能屢屢擠入這個暢銷榜內。但在上周的名單中,Valve Index跌出Steam每周暢銷榜TOP10,這是Va...
VR
對于沉浸式內容,在AR和VR中創建數字化身是一個需求,但同時是一個技術挑戰。對于初學者來說,這或許比在3D中創建對象和環境要困難得多。
VR
盛夏8月,一場屬于AR/VR行業的盛會——AWE(Augmented World Expo)增強現實世界博覽會在深圳成功舉行。AWE聚焦全球最前沿的AR/VR技術、匯集AR/VR行業最高端人才,與會的行業內佼佼者們紛紛展示各家研發新...
VR
上周8月14日,因為Epic Games在游戲《堡壘之夜》增加了一種可繞開蘋果和谷歌支付系統以規避30%抽成的新內購機制,蘋果和谷歌相繼下架《堡壘之夜》。Epic Games于是就壟斷問題起訴了這家平臺巨頭,并且發起...
VR

相關推薦

1
3
久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

    9000px;">

      亚洲123区在线观看| 日日摸夜夜添夜夜添亚洲女人| 精品国产伦理网| 综合自拍亚洲综合图不卡区| 日韩专区一卡二卡| 国产91清纯白嫩初高中在线观看| 欧洲一区二区三区在线| 久久久99免费| 亚洲国产综合视频在线观看| 国产成人无遮挡在线视频| 欧美精品久久天天躁| 国产精品久久久爽爽爽麻豆色哟哟 | 欧美在线观看一区二区| 精品sm在线观看| 亚洲成国产人片在线观看| 不卡的av在线播放| 久久久久国产精品麻豆| 美女爽到高潮91| 欧美日韩精品电影| 悠悠色在线精品| 一本一道久久a久久精品| 国产丝袜欧美中文另类| 国产综合久久久久久鬼色| 欧美日韩精品二区第二页| 亚洲欧美日韩国产手机在线| 国产精品中文字幕一区二区三区| 日韩一区二区三区电影在线观看 | 五月天欧美精品| 91成人免费在线视频| 日本麻豆一区二区三区视频| 在线观看日韩毛片| 精品国精品自拍自在线| 日韩av一二三| 欧美群妇大交群中文字幕| 一区二区三区中文字幕电影| 一本色道综合亚洲| 亚洲黄色性网站| 91黄视频在线观看| 性做久久久久久免费观看欧美| 欧美日韩三级一区| 丝袜亚洲另类欧美综合| 91精品国产欧美一区二区| 美女在线一区二区| 2020国产精品久久精品美国| 国产美女精品在线| 日本一区二区三区dvd视频在线| 国产成人免费视频精品含羞草妖精| 久久久国产一区二区三区四区小说 | 国产福利视频一区二区三区| 国产日产欧产精品推荐色| 成人午夜视频网站| 亚洲卡通欧美制服中文| 欧美无乱码久久久免费午夜一区 | 男人的j进女人的j一区| 欧美成人欧美edvon| 国产精品自拍一区| 最新久久zyz资源站| 欧美性欧美巨大黑白大战| 日韩成人精品视频| 欧美国产视频在线| 欧美亚洲一区三区| 黄色日韩网站视频| 亚洲欧美在线视频| 8x8x8国产精品| 国产91精品一区二区麻豆网站| 亚洲四区在线观看| 91精品国产综合久久久久久久 | 国模大尺度一区二区三区| 一区二区三区高清在线| 在线91免费看| 成人av资源下载| 日本三级亚洲精品| 中文字幕一区二区三区色视频| 欧美主播一区二区三区| 国产麻豆午夜三级精品| 亚洲一区二区视频在线| 精品国产sm最大网站| 色综合天天视频在线观看| 免费成人av资源网| 亚洲精品视频免费看| www一区二区| 在线不卡的av| 91浏览器打开| 国产精品77777| 青青草成人在线观看| 亚洲欧美一区二区三区国产精品| 欧美一个色资源| 91在线视频播放| 国产又粗又猛又爽又黄91精品| 亚洲综合无码一区二区| 日本一区二区三区久久久久久久久不 | 欧美成人免费网站| 欧美视频日韩视频| 波多野结衣一区二区三区| 麻豆精品一区二区| 首页国产欧美久久| 最新中文字幕一区二区三区| 久久久精品免费免费| 91麻豆精品国产91久久久久久久久| 99精品视频在线免费观看| 国模套图日韩精品一区二区| 日韩激情一二三区| 亚洲一区二区三区四区在线免费观看| 国产欧美一区二区三区沐欲| 精品美女一区二区| 日韩一区二区三免费高清| 在线一区二区三区做爰视频网站| 成人h精品动漫一区二区三区| 国产一区二区在线视频| 久久成人18免费观看| 日本成人在线一区| 日韩影院在线观看| 亚洲高清免费观看| 一区二区三区不卡视频| 樱花影视一区二区| 亚洲欧美电影院| 亚洲欧美日韩系列| 亚洲精品日韩综合观看成人91| 国产精品久久看| 亚洲天堂2014| 一区二区三区免费观看| 尤物在线观看一区| 午夜亚洲福利老司机| 日韩精品一级中文字幕精品视频免费观看| 亚洲精品国产视频| 亚洲国产成人精品视频| 石原莉奈在线亚洲二区| 免费在线观看一区| 黑人巨大精品欧美一区| 国产麻豆精品久久一二三| 国产裸体歌舞团一区二区| 国产精品1区2区3区在线观看| 国产精品亚洲专一区二区三区| 国产成人一区二区精品非洲| 成人av在线电影| 欧美优质美女网站| 9191久久久久久久久久久| 亚洲免费观看在线视频| 亚洲国产精品成人综合色在线婷婷| 中文文精品字幕一区二区| |精品福利一区二区三区| 一区二区免费视频| 日本 国产 欧美色综合| 国产精品一区专区| 不卡视频在线观看| 欧美亚洲国产怡红院影院| 欧美一区二区美女| 国产日韩欧美不卡| 亚洲乱码国产乱码精品精小说 | 欧美精品v国产精品v日韩精品| 日韩一级高清毛片| 中文字幕精品一区| 亚洲一区二区三区四区在线观看| 日本aⅴ亚洲精品中文乱码| 国产v综合v亚洲欧| 色8久久人人97超碰香蕉987| 日韩限制级电影在线观看| 国产精品欧美精品| 亚洲综合小说图片| 国产精品原创巨作av| 色狠狠av一区二区三区| 欧美一区二区三区电影| 国产精品电影院| 久久精品国产成人一区二区三区| 成人一道本在线| 欧美一区二区三区在线电影| 中文字幕在线观看不卡| 免费观看一级欧美片| 一本大道综合伊人精品热热| 精品剧情在线观看| 一区二区三区四区高清精品免费观看 | 丁香激情综合五月| 欧美日本视频在线| 中文字幕乱码久久午夜不卡| 石原莉奈在线亚洲三区| hitomi一区二区三区精品| 日韩欧美一区二区久久婷婷| 亚洲乱码国产乱码精品精可以看 | 蜜臀va亚洲va欧美va天堂| 91亚洲精品乱码久久久久久蜜桃| 欧美日韩精品一区二区三区| 国产精品久久久久三级| 蜜臀av国产精品久久久久| 欧美日精品一区视频| 国产精品天美传媒| 国产资源精品在线观看| 欧美日高清视频| 亚洲日本在线天堂| 久久国产精品免费| 555夜色666亚洲国产免| 亚洲一区在线观看网站| 不卡的电影网站| 欧美激情一区二区三区不卡 | 97久久精品人人澡人人爽| 久久久一区二区| 激情成人综合网| 2020国产精品自拍| 久草这里只有精品视频| 欧美精品第1页| 日韩高清中文字幕一区|