聽 6 秒鐘語音,這個 AI 就能知道你長什么樣

    人工智能
    2019
    06/09
    23:29
    愛范兒
    分享
    評論

    聲音可以暴露很多信息,比如說,廣東人跟東北人講的普通話永遠都不是一個味兒。

    而麻省理工學院(MIT)最近一項研究發現,經過訓練的 AI 不僅能從聲音里辨別出你的性別、年齡和種族,甚至能猜出你大概長什么樣。這些「秘密」都藏不住了。

    ▲ 圖自《華爾街日報》

    研究人員用一個由數百萬 YouTube 視頻剪輯組成的數據集,對一個名為 Speech2Face 的神經網絡模型進行自我訓練,從最終結果來看,6 秒語音對人臉進行還原的效果還算不錯。

    ▲ 一共 6 組結果示例,左邊是視頻里的人像,右邊是 AI 根據聲音還原的效果

    Speech2Face 模型的運作大概分為兩部分,一個是語音編碼器,負責對輸入的語音進行分析,預測出相關的面部特征;另一個則是面部解碼器,對輸入的面部特征進行整合產生圖像。

    MIT 研究團隊指出,他們的目的不是為了準確地還原說話者的模樣,Speech2Face 模型主要是為了研究語音跟相貌之間的相關性。

    從訓練結果看,Speech2Face 能較好地識別出性別,對白種人和亞洲人也能較好地分辨出來,另外對 30-40 歲和 70 歲的年齡段聲音命中率稍微高一些。

    ▲ Speech2Face 似乎傾向將 30 歲以下的說話者年齡猜大,將 40-70 歲的說話者年齡猜小

    除了比較基礎的性別、年齡和種族,Speech2Face 甚至能猜中一些面部特征,比如說鼻子的結構、嘴唇的厚度和形狀、咬合情況,以及大概的面部骨架。基本上輸入的語音時間越長,AI 的準確度會越高。

    當然 AI 的「聽覺」也會出錯。研究人員發現,它會將未經歷變聲期的小男孩識別為女性,對一些說話者的口音判斷錯誤,也會搞混年紀 …… 這一點完全可以理解,畢竟聲音還是會騙人的,夜夜伴你入睡的萌妹奶音主播,實際上說不定就是個摳腳硬漢。

    ▲ Speech2Face 的一些錯誤示例

    研究人員指出,Speech2Face 的局限性,部分原因來自數據集里的說話者本身種族多樣性不夠豐富,這也導致了它辨認黑種人聲音的能力比較弱。

    至于他們對這個 AI 模型的應用,則有一個很可愛的想象:只需要說幾句話,未來 Animoji 和 Gboard 等功能或許就能根據聲音生成你的卡通頭像。

    ▲ 圖自 Independent

    不管你信或不信,藏在我們聲音的秘密都正被開發研究,投入各式各樣的場景應用。

    卡內基梅隆大學計算機副教授 Rita Singh 也主導過一項類似的研究,能從聲音猜測說話者的年齡、身高、體重、環境噪音和說話時的空間類型等信息。她認為聲音里藏著豐富而獨特的信息,「就像是你的 DNA 或指紋」。

    這項技術后來升級成跟 Speech2Face 相似的語音分析系統,還原人臉的準確度達到 60%-70%,目前正被美國海岸警衛隊用于縮小調查范圍找到惡作劇報警者。據稱,他們每年會接到約 150 個惡作劇電話,這些行為被視作浪費警力,甚至會遭到刑事起訴。

    ▲ 聽起來就像是刑偵劇里的犯罪側寫師

    目前,匯豐、渣打、摩根大通等銀行都在用「聲紋」作為身份識別的一種方式(voice ID),可以檢測你的賬戶是否被盜。

    大都會人壽保險公司的客服中心,會用一套 AI 系統幫忙識別客戶的情緒和感受,平均準確率達到 82%;一些保險公司甚至會借此判斷來電者有沒有騙保的意圖——如果說話時出現微小停頓,很可能就是在提供虛假信息。

    除此之外,經過訓練的 AI 還被一些公司用于招聘,從應聘者的說話模式分析出性格特征,判斷是否適合在招崗位。

    而豐田汽車曾經在 2017 年 CES 大會展出 Concept-i 概念車型,車內配備紅外攝像頭、傳感器、車載語音識別和對話系統,它們將協作判斷司機是不是處于疲勞駕駛狀態并作出提醒。

    跟 MIT 的卡通頭像相比,Singh 教授的想法似乎要更長遠且宏大一些。她希望,有朝一日語音識別技術可以用于遠程確診帕金森等疾病。

    ▲ 圖自 NewScientist

    而目前已經有研究發現,冠狀動脈疾病患者在聲音上會留有不同的頻率標志。未來,「聽聲看病」說不定也會跟「聽聲識臉」一樣成真。

    【來源:愛范兒】

    THE END
    廣告、內容合作請點擊這里 尋求合作
    ai
    免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

    相關熱點

    困難重重的AI“辯味”。
    人工智能
    今天凌晨,一年一度的蘋果WWDC 19全球開發者大會在美國圣何塞舉辦,蘋果更新了自家系統平臺macOS、iOS、watchOS、tvOS以及今年剛剛加入的iPadOS。
    業界
    5月27日消息,人工智能的飛速發展,能給傳媒帶來什么樣的發展機遇?
    業界
    今天,YC中國在中關村舉辦創業者見面會,YC中國創始人及CEO、YC全球研究院院長陸奇圍繞《技術驅動創業帶來的創業機會》主題展開深度分享。
    業界
    北京時間今天凌晨,谷歌I/O開發者大會拉開序幕,谷歌推出Pixel 3A以及Pixel 3A XL兩款新機型以及Nest Hub Max控制中樞,還宣布了Android Q新系統和Assistant(谷歌助手)的最新進展。
    業界

    相關推薦

    1
    3
    主站蜘蛛池模板: 国产精品无码一区二区三区毛片 | 亚洲AV香蕉一区区二区三区| 亚洲色偷精品一区二区三区| 国产精品亚洲一区二区麻豆 | 成人影片一区免费观看| 香蕉视频一区二区| 99国产精品一区二区| 亚洲丰满熟女一区二区v| 在线视频亚洲一区| 国产在线精品一区二区三区直播 | 东京热人妻无码一区二区av| 国产精品一区二区av| 亚洲va乱码一区二区三区| 国产亚洲一区二区三区在线不卡| 亚洲成a人一区二区三区| 人妻无码视频一区二区三区| 国产人妖视频一区在线观看| 人妻无码一区二区三区AV| 影院无码人妻精品一区二区| 麻豆一区二区在我观看| 一区二区三区午夜视频| 日韩高清一区二区三区不卡| 免费日本一区二区| 国产午夜精品一区二区三区| 中文字幕日本一区| 久夜色精品国产一区二区三区| 久久精品无码一区二区三区免费| 久久国产精品视频一区| 精品无码一区二区三区亚洲桃色| 日韩精品一区二区三区国语自制| 国产日韩一区二区三区在线播放| 成人免费区一区二区三区| 爆乳熟妇一区二区三区| 少妇无码AV无码一区| 久久99精品国产一区二区三区| 久久青草国产精品一区| 在线日产精品一区| 人成精品视频三区二区一区| 久久se精品一区二区影院| 亚洲成a人一区二区三区| 国产日韩高清一区二区三区|