久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

多模態(tài)時代來了!AI虛擬數(shù)字人,掀起百億數(shù)據(jù)服務(wù)新藍海

有態(tài)度
2022
01/25
21:34
智東西
分享
評論

來源:智東西

作者 | 心緣

編輯 | 漠影

寫在前面:元宇宙、虛擬數(shù)字人概念火爆的2021,高質(zhì)量訓(xùn)練數(shù)據(jù)資源正成為雄心勃勃的AI企業(yè)們解鎖更強智能的關(guān)鍵燃料,通過對話國內(nèi)唯一A股上市數(shù)據(jù)服務(wù)商海天瑞聲,我們試圖探討隱藏于這場新興技術(shù)浪潮幕后的基石角色,如何運用技術(shù)解決智能化升級過程中的核心痛點。

2022年,再不關(guān)注虛擬數(shù)字人,你就落伍啦!

在剛剛過去的一年,AI虛擬主播、虛擬學(xué)生、虛擬員工輪番上崗,成為元宇宙與人工智能兩大領(lǐng)域最熱門的技術(shù)賽道之一。

▲萬科首位數(shù)字化員工崔筱盼獲得萬科總部最佳新人獎

有些虛擬數(shù)字人已經(jīng)表現(xiàn)得靈性十足,不僅發(fā)音標準自然、身體動作流暢,就連眨眼頻率、口型與聲音的匹配等細節(jié)都惟妙惟肖。

這些火遍大江南北的特殊生命體,通過越來越多元的形象定制、舒適的交互體驗,逐漸轉(zhuǎn)變?yōu)閾碛懈咏鎸嵢祟愔巧毯颓楦械男滦蜕鐣巧?/p>

而「多模態(tài)技術(shù)」,正是打破單一感官的藩籬,讓AI虛擬形象越來越像人類的秘密武器。

一、破圈而來,“完美”虛擬人離不開的多模態(tài)

數(shù)據(jù),是將真實世界與虛擬世界連接的橋梁。

在現(xiàn)實世界中,數(shù)據(jù)天然以「多模態(tài)」的形式存在,人類通過綜合運用視覺、聽覺、觸覺、嗅覺等多種感官,來接觸和理解大千世界。

為了探索實現(xiàn)通用人工智能(AGI)的路徑,人工智能(AI)從單模態(tài)走向多模態(tài)已是大勢所趨。

以前,Siri等語音助手只有聲音沒有臉,搜索只能依靠輸入文字,機器看不懂照片的深層含義。

如今,借助多模態(tài)技術(shù),AI實現(xiàn)了圖像、視頻、音頻、語義文本等多維度資源的融合互補,不僅決策更加精準,還在行為和智商上更接近人類。

新冠疫情亦催化了多模態(tài)技術(shù)的落地進程。在隱私安全保護重視程度日益加強的趨勢下,多模態(tài)生物識別憑借更高的準確率和安全性,正取代基于指紋、人臉等單一生物特征的身份識別方法。

而深藏多種黑科技的AI虛擬主播,亦是基于多模態(tài)技術(shù)的快速演進,成為感知智能邁向認知智能階段的重要探索。

它們的精致面容、流暢表達、優(yōu)美體態(tài),離不開微表情追蹤、語音識別、語音合成、自然語言理解、動作捕捉等豐富技術(shù)的支撐。

▲虛擬數(shù)字人技術(shù)架構(gòu)(來源:《2020年虛擬數(shù)字人發(fā)展白皮書》)

其中,AI手語主播要解決的技術(shù)難點尤其復(fù)雜。為了照顧到聽障人士的需求,它需要具備實時將中文、英文等語音“翻譯”成連貫手語的能力。

但手語有一套獨特的語法體系,如果來一段央視押韻狂魔朱廣權(quán)的段子“冷空氣非常強,但他強任他強,清風拂山崗,他橫任他橫,秋褲保健康”,那就極度考驗AI手語主播的理解和翻譯水準了。

要做到實時精確演示手語,AI主播需先將語音轉(zhuǎn)化成文字,再將健聽人士的文本語序轉(zhuǎn)化成手語語序,最后基于手語數(shù)據(jù)集進行手語合成,將相同的信息以視覺的形式傳遞給聽障人士。

在此過程中,獲得符合需求的訓(xùn)練數(shù)據(jù)成為了最具挑戰(zhàn)性的問題之一。

這是因為,作為一種視覺語言,手語語言遠比語音語言模態(tài)復(fù)雜,既包含手型、手部位置等手控信息,又包含表情、口動、體態(tài)等非手控信息。

如果從2D視頻來采集手語運動過程中的數(shù)據(jù),則不可避免會遇到動作被遮擋、人臉五官各區(qū)域區(qū)分不明顯、空間深度信息缺失等問題。

▲央視冬奧AI手語主播

綜合看來,通過專業(yè)設(shè)備采集的3D多模態(tài)數(shù)據(jù),已經(jīng)成為優(yōu)化特定垂直場景AI虛擬數(shù)字人的智能化水平中,為數(shù)不多的解決方案之一。

怎樣獲得高品質(zhì)的多模態(tài)訓(xùn)練數(shù)據(jù)庫?AI基礎(chǔ)數(shù)據(jù)服務(wù)商的商業(yè)價值開始日益凸顯。

二、優(yōu)質(zhì)算法“殺手锏”:高質(zhì)量數(shù)據(jù)背后的技術(shù)試煉

數(shù)據(jù)、算法、算力被并稱為「AI三要素」,數(shù)據(jù)質(zhì)量的高低,往往決定AI算法模型的性能上限

隨著AI應(yīng)用逐漸普及,位于基礎(chǔ)設(shè)施層的AI數(shù)據(jù)服務(wù)行業(yè)正發(fā)展地風生水起。根據(jù)知名市研機構(gòu)IDC報告,到2025年,中國AI數(shù)據(jù)采標服務(wù)市場規(guī)模預(yù)計將增至123.4億元。

▲2020-2025年中國AI基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模預(yù)測(來源:IDC中國)

但如果你認為AI基礎(chǔ)數(shù)據(jù)服務(wù)是個純?nèi)斯ぷ鞣唬悄憔吞∏七@個行業(yè)的技術(shù)含量了。

尤其是多模態(tài)技術(shù)爆發(fā)以來,相應(yīng)的對多模態(tài)數(shù)據(jù)需求的增長,逐步暴露了“作坊式”數(shù)據(jù)采標團隊“人海”戰(zhàn)術(shù)的短板,整個數(shù)據(jù)市場正向滿足客戶長尾需求演進,對服務(wù)商技術(shù)屬性的要求一再加碼。

如何制定與算法匹配的數(shù)據(jù)方案?如何同步采集不同模態(tài)的數(shù)據(jù)?如何處理丟失的數(shù)據(jù)?如何保證不同模態(tài)數(shù)據(jù)的精準對齊?這些都極度考驗AI數(shù)據(jù)服務(wù)商的技術(shù)能力。

以獲評國家工信部新一代人工智能產(chǎn)業(yè)創(chuàng)新重點任務(wù)揭榜優(yōu)勝單位、國家專精特新“小巨人”企業(yè)、國家重點軟件企業(yè)的海天瑞聲為例,這家企業(yè)在中國AI基礎(chǔ)數(shù)據(jù)采標服務(wù)市場中排名前列,也是A股唯一的AI數(shù)據(jù)服務(wù)上市公司,其多模態(tài)訓(xùn)練數(shù)據(jù)解決方案最近獲得了智東西2021年度AI生產(chǎn)力創(chuàng)新獎。

根據(jù)其IPO文件,AI數(shù)據(jù)服務(wù)的核心技術(shù)可分為三個層次:訓(xùn)練數(shù)據(jù)生產(chǎn)(包括設(shè)計、采集、加工、質(zhì)檢),平臺工具(一體化數(shù)據(jù)處理平臺)以及基礎(chǔ)研究(語音識別、語音合成、計算機視覺、訓(xùn)練數(shù)據(jù)集設(shè)計技術(shù)等)。

其中,在訓(xùn)練數(shù)據(jù)生產(chǎn)層,多語種多模態(tài)訓(xùn)練數(shù)據(jù)設(shè)計技術(shù)、采集及標注技術(shù)是高質(zhì)量訓(xùn)練數(shù)據(jù)的生產(chǎn)基礎(chǔ)

首先在設(shè)計階段,為了滿足AI算法的需求,AI數(shù)據(jù)服務(wù)商需深入理解客戶算法和應(yīng)用場景,設(shè)計與之最優(yōu)匹配的多模態(tài)訓(xùn)練數(shù)據(jù)結(jié)構(gòu),并制定合理的原料數(shù)據(jù)采集方案。

通過設(shè)計多設(shè)備采集方案,以便同時獲取人發(fā)出的語音、視頻畫面、精細唇部動作等不同模態(tài)的信息,便于客戶匹配自身算法模型框架,實現(xiàn)視覺、聽覺等融合的多維度交互。整個過程非常考驗AI數(shù)據(jù)服務(wù)商的技術(shù)儲備和工程能力。

其次,在實際的采集環(huán)節(jié)中,數(shù)據(jù)損耗是常事,且造成損耗的原因迥異,而有經(jīng)驗的AI數(shù)據(jù)服務(wù)商能用技術(shù)快速找出解法。

我們繼續(xù)以AI手語合成主播為例,采集手語數(shù)據(jù)會用到裝有傳感器的手套,這些手套由于并非專為手語而設(shè)計,因此在采集過程中難免會出現(xiàn)數(shù)據(jù)丟失的問題,一個動作很可能要做上百幀的數(shù)據(jù)修復(fù),耗時耗力。

發(fā)現(xiàn)這一問題后,海天瑞聲技術(shù)研發(fā)團隊迅速啟動應(yīng)對方案,歷經(jīng)半個月研發(fā)出一款與硬件采集設(shè)備相匹配的自動導(dǎo)出、修復(fù)工具,極大提升了數(shù)據(jù)的處理效率。

修復(fù)好數(shù)據(jù),還要應(yīng)對「精細對齊」的挑戰(zhàn)。

在虛擬數(shù)字人、智能座艙等場景中,越來越多應(yīng)用開始將語音識別和計算機視覺結(jié)合,以提高理解人類意圖的準確率。

像這樣需用多個攝像頭、傳感器等設(shè)備來采集數(shù)據(jù)的應(yīng)用,又帶來新的難題——如何將不同設(shè)備記錄的影像、聲音等數(shù)據(jù),實現(xiàn)同步標注對齊?

▲不同通道錄制的語音數(shù)據(jù)不對齊情況示例

大規(guī)模標注數(shù)據(jù)本來就是AI模型進一步優(yōu)化性能的瓶頸,而多模態(tài)數(shù)據(jù)不僅標注工作量是單模態(tài)的數(shù)倍,還要解決多設(shè)備采集數(shù)據(jù)同步難的問題,這會進一步增加后續(xù)數(shù)據(jù)加工難度。

對此,海天瑞聲的解決思路是自研多通道采集工具和數(shù)據(jù)同步技術(shù),多通道采集工具支持4路甚至更多語音數(shù)據(jù)同時錄入、自動對齊整合,數(shù)據(jù)同步技術(shù)可實現(xiàn)多通道采集原料數(shù)據(jù)的自動對齊,并做到多音頻文件起始點自動對齊誤差小于1毫秒,大幅提升訓(xùn)練數(shù)據(jù)生產(chǎn)效率和質(zhì)量。

借助數(shù)據(jù)同步技術(shù),唇形動作與聲音的對齊能精確到毫秒級,這也是可以避免虛擬數(shù)字人說話時音畫不同步、對不上口型等尷尬局面背后的重要因素之一。

三、為更強智能輸送燃料,多模態(tài)數(shù)據(jù)強勢崛起

哪個AI應(yīng)用不想實現(xiàn)更高的準確率、更自然貼心的交互能力呢?在更強智能需求的拉動下,基于多模態(tài)數(shù)據(jù)的AI算法模型日漸成為主流。

▲微軟多模態(tài)預(yù)訓(xùn)練模型「女媧」可根據(jù)文本內(nèi)容生成相應(yīng)視頻

例如公安、金融等場景的身份鑒定,電商場景下的智能客服交互,未來自動駕駛場景的艙內(nèi)艙外交互等等,數(shù)據(jù)準確率越高,有助于抵御越多的安全風險。而多模態(tài)生物識別不僅有助于保護信息安全,還能應(yīng)對單一模態(tài)無法有效識別的戴口罩、手指磨繭、整容等特殊情況。

▲單一生物識別技術(shù)的特點

可以看到,如今AI垂直應(yīng)用場景呈現(xiàn)碎片化特征,對多模態(tài)數(shù)據(jù)的需求更加復(fù)雜和長尾化。

這些新業(yè)務(wù)場景需求的變化,更為考驗AI數(shù)據(jù)服務(wù)商處理復(fù)雜交叉業(yè)務(wù)場景數(shù)據(jù)的綜合能力。

因此AI數(shù)據(jù)服務(wù)商必須具備與客戶算法團隊平行溝通的技術(shù)儲備,理解客戶希望用數(shù)據(jù)解決什么問題、設(shè)計什么結(jié)構(gòu)的模型,才能用最小代價,給出高效高質(zhì)的數(shù)據(jù)集解決方案,保證客戶算法取得盡可能好的落地效果。

在這樣的趨勢下,海天瑞聲等頭部品牌數(shù)據(jù)服務(wù)商的資源優(yōu)勢將被進一步放大。

從海天瑞聲的IPO文件可以看到,這家公司已經(jīng)積累了近千個自有知識產(chǎn)權(quán)的訓(xùn)練數(shù)據(jù)產(chǎn)品、服務(wù)微軟、阿里巴巴、騰訊、百度、三星、字節(jié)跳動、亞馬遜、科大訊飛、商湯科技、中國科學(xué)院、清華大學(xué)等超過500家國內(nèi)外客戶,并持有信息安全認證證書ISO/IEC 27701及管理體系認證證書ISO/IEC 27001。

▲2018-2020年海天瑞聲前五大客戶情況

過去三年,海天瑞聲的前五大客戶呈現(xiàn)高復(fù)購率,足見其產(chǎn)品的高粘性。

無論是知名科技公司的背書,還是經(jīng)年累月沉淀的多語種語言學(xué)家團隊資源和穩(wěn)定合作的供應(yīng)商、客戶等上下游資源,都使得兼具技術(shù)壁壘與業(yè)務(wù)經(jīng)驗的品牌數(shù)據(jù)服務(wù)商,更易成為確保多模態(tài)數(shù)據(jù)高效高質(zhì)交付的首選。

結(jié)語:多模態(tài)終將主導(dǎo)智能產(chǎn)業(yè)未來

AI算法要想高質(zhì)量,多模態(tài)數(shù)據(jù)得跟得上。

過去一年,應(yīng)用場景的創(chuàng)新和機器學(xué)習算法的流行繼續(xù)帶動訓(xùn)練數(shù)據(jù)需求爆發(fā)式增長。

在多模態(tài)大模型、虛擬數(shù)字人等熱門技術(shù)方向的驅(qū)動下,持續(xù)探索更強智能的AI應(yīng)用,對高質(zhì)量多模態(tài)訓(xùn)練數(shù)據(jù)資產(chǎn)的需求愈發(fā)迫切。

當前多模態(tài)技術(shù)仍處于起步階段,多維度信息的轉(zhuǎn)化和融合尚不成熟,在真實場景下的泛化能力較為受限,距離實現(xiàn)人類級別的多模態(tài)感知能力還有較長的路要走。

這需要研發(fā)多模態(tài)AI應(yīng)用的企業(yè)或研究機構(gòu)與AI基礎(chǔ)數(shù)據(jù)服務(wù)商長期磨合,摸索出更加符合人類認知習慣的前沿多模態(tài)技術(shù),幫助AI全面理解真實世界,最終更好地服務(wù)于未來的人類社會。

THE END
廣告、內(nèi)容合作請點擊這里 尋求合作
深度
免責聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點和立場。

相關(guān)熱點

對于互聯(lián)網(wǎng)而言,社交需求是其用戶最原始也是最基本的需求,任何產(chǎn)品都不愿意放過這一需求。
態(tài)度
“最嫩的一波韭菜”,當賽力斯SF5疑似被停產(chǎn)后,車主們自我調(diào)侃道。
態(tài)度
美股上市、連年虧損、市值5400萬美元的團車網(wǎng),在1月5日官宣造車,并發(fā)微博@蔚來汽車、理想汽車、小鵬汽車,配文:“你們覺得擠不?”
態(tài)度
據(jù)新浪財經(jīng)1月14日報道,有市場消息稱知乎將考慮在香港IPO,籌資約3億美元。
態(tài)度
95后小沙回憶,10多年前,父母會說“你這次考試考一百分,我就帶你去吃肯德基。”如今,每次在吃什么上犯難的時候,小沙和朋友就會說“要不就吃肯德基算了。”
態(tài)度

相關(guān)推薦

1
3
久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

    9000px;">

      色婷婷av一区二区三区软件| 欧美色男人天堂| 一道本成人在线| 一区二区三区四区av| 欧美日韩亚洲综合一区| 亚洲va欧美va天堂v国产综合| 欧美美女黄视频| 理论电影国产精品| 国产精品激情偷乱一区二区∴| 99热99精品| 亚洲h动漫在线| 日韩三级伦理片妻子的秘密按摩| 欧美一级艳片视频免费观看| 亚洲三级免费电影| 精品一区二区三区在线观看| 欧美亚洲日本国产| 国产精品每日更新在线播放网址| 琪琪一区二区三区| 欧美三级一区二区| 中文字幕亚洲精品在线观看| 国产一区在线观看麻豆| 制服丝袜成人动漫| 亚洲一线二线三线视频| eeuss鲁片一区二区三区在线看| 欧美va亚洲va香蕉在线| 午夜视频在线观看一区二区| 91免费视频观看| 国产欧美日韩精品在线| 美日韩一级片在线观看| 欧美日韩成人高清| 亚洲图片欧美综合| 在线欧美日韩国产| 一区二区三区中文在线| 97国产精品videossex| 中文字幕第一区二区| 高清不卡一二三区| 国产欧美一区二区精品性色超碰| 裸体歌舞表演一区二区| 91精品麻豆日日躁夜夜躁| 午夜免费欧美电影| 欧美日韩国产综合视频在线观看| 亚洲一区二三区| 精品处破学生在线二十三| 亚洲成av人片在线| 在线看不卡av| 亚洲午夜免费视频| 欧美男人的天堂一二区| 亚洲一区二区三区美女| 91免费版在线| 一区二区三区国产精华| 在线影院国内精品| 亚洲男人的天堂在线aⅴ视频| 成人av动漫网站| 亚洲天堂精品在线观看| 国产一区二区在线免费观看| 日本女优在线视频一区二区| 亚洲国产视频一区| 日韩成人一区二区三区在线观看| 日精品一区二区| 亚洲高清视频的网址| 91在线你懂得| 亚洲电影在线免费观看| 欧美成人在线直播| 丁香婷婷深情五月亚洲| 1000精品久久久久久久久| 在线观看日韩一区| 日韩成人一级大片| 欧美精品一区男女天堂| www.亚洲在线| 亚洲国产成人av| 久久亚洲免费视频| 精品国产91久久久久久久妲己| 精品国产欧美一区二区| 国产精品美女久久久久久久网站| 日韩美女视频19| 天天综合色天天综合色h| 久久国产精品区| 国产91精品一区二区麻豆亚洲| av在线免费不卡| 欧美军同video69gay| 久久影院视频免费| 亚洲欧美成aⅴ人在线观看| 日本特黄久久久高潮| 成人免费观看av| 欧美狂野另类xxxxoooo| 国产欧美日韩亚州综合| 一区二区三区在线观看国产 | 91免费观看在线| 欧美日韩一区在线观看| 久久日一线二线三线suv| 亚洲欧美区自拍先锋| 久久av资源站| 色94色欧美sute亚洲线路二| 日韩三级在线观看| 最新成人av在线| 色婷婷综合久久久中文字幕| 欧美三级电影在线观看| 国产亚洲一区二区三区| 亚洲综合色丁香婷婷六月图片| 精品亚洲aⅴ乱码一区二区三区| 91在线看国产| 久久九九久久九九| 日韩中文字幕91| 91麻豆精品在线观看| 久久久久99精品一区| 日本在线不卡一区| 欧美影视一区二区三区| 亚洲欧洲精品一区二区精品久久久| 日产精品久久久久久久性色| 欧美性淫爽ww久久久久无| 中文字幕制服丝袜一区二区三区| 精品一区二区三区在线观看 | 青青草精品视频| 99久久精品免费看| 国产亚洲欧美激情| 激情欧美一区二区| 日韩视频不卡中文| 午夜精品123| 欧美日韩免费在线视频| 亚洲高清免费观看| 91极品视觉盛宴| 一区二区三区日韩精品视频| 99精品一区二区| 综合久久一区二区三区| 99re热这里只有精品视频| 亚洲欧洲性图库| 99精品桃花视频在线观看| 中文字幕av不卡| 蜜臀av一区二区| 精品理论电影在线观看| 久久草av在线| 久久久久久97三级| 国内精品伊人久久久久av一坑 | 欧美一区二区在线播放| 亚洲va天堂va国产va久| 精品视频在线视频| 午夜欧美2019年伦理| 欧美老年两性高潮| 中文字幕一区在线观看视频| 精品成人一区二区| 国产午夜精品一区二区三区视频 | 亚洲高清久久久| 天天影视网天天综合色在线播放| 日韩制服丝袜av| 久久成人免费电影| 成人激情动漫在线观看| 91一区二区在线观看| 欧美日韩精品综合在线| 日韩视频123| 国产精品视频一区二区三区不卡| 成人免费在线播放视频| 亚洲最新在线观看| 奇米四色…亚洲| 国产一区视频在线看| 97久久精品人人做人人爽| 欧美日韩精品二区第二页| 欧美成人综合网站| 国产精品福利av| 亚洲成人午夜电影| 精品一区二区三区蜜桃| 国产成+人+日韩+欧美+亚洲| 在线亚洲人成电影网站色www| 欧美日韩国产一级片| 精品1区2区在线观看| 亚洲精品国产一区二区精华液| 美女视频黄久久| www.综合网.com| 777欧美精品| 国产精品免费人成网站| 香蕉久久一区二区不卡无毒影院| 国产一区二区三区视频在线播放| 99久久国产综合精品女不卡| 日韩欧美国产精品一区| 国产精品一区二区在线观看不卡| 国产69精品一区二区亚洲孕妇| 日本精品免费观看高清观看| 日韩欧美一区在线| 亚洲精品亚洲人成人网| 久久99精品视频| 在线看日韩精品电影| 久久久青草青青国产亚洲免观| 亚洲综合色婷婷| 粉嫩av亚洲一区二区图片| 欧美一卡二卡在线| 亚洲电影你懂得| www..com久久爱| 久久综合丝袜日本网| 亚洲国产一区在线观看| 波多野结衣中文字幕一区| 精品久久久久久久一区二区蜜臀| 亚洲一线二线三线视频| 大桥未久av一区二区三区中文| 日韩免费观看2025年上映的电影 | 一区二区三区91| 国产999精品久久久久久绿帽| 日韩欧美一级特黄在线播放| 亚洲国产视频直播| 色欧美片视频在线观看在线视频| 国产香蕉久久精品综合网| 裸体歌舞表演一区二区|