10 月 6 日至 17 日,國際電信聯(lián)盟第二十一研究組(簡稱 ITU-T SG21)在瑞士日內(nèi)瓦召開全體會議,兩項(xiàng)數(shù)字人國際標(biāo)準(zhǔn) ITU-T F.748.63「Framework and general technical requirements of foundation model enhanced digital human system」(基礎(chǔ)模型增強(qiáng)的數(shù)字人系統(tǒng)框架及通用技術(shù)要求)、ITU-T F.748.64「Requirements of digital human service platform」(數(shù)字人服務(wù)平臺要求)順利通過結(jié)項(xiàng),計(jì)劃于 2026 年正式發(fā)布。

值得關(guān)注的是,科大訊飛與中國信通院共同擔(dān)任這兩項(xiàng)標(biāo)準(zhǔn)的編輯人。這意味著科大訊飛在數(shù)字人標(biāo)準(zhǔn)的技術(shù)框架、核心定義及規(guī)范要求制定中發(fā)揮了重要作用,既是對其數(shù)字人技術(shù)實(shí)踐能力的認(rèn)可,也體現(xiàn)了中國科技企業(yè)在全球人工智能與數(shù)字人領(lǐng)域日益提升的參與度和影響力。
1 硬核 AI 實(shí)力,為數(shù)字人注入「智慧靈魂」
此次科大訊飛能夠主導(dǎo)國際標(biāo)準(zhǔn)的制定,離不開它在人工智能領(lǐng)域長期的技術(shù)積累和廣泛的產(chǎn)品應(yīng)用。
技術(shù)積累:全棧式 AI 能力
國際標(biāo)準(zhǔn)的制定,往往源于產(chǎn)業(yè)實(shí)踐的廣泛凝練與共識。ITU 標(biāo)準(zhǔn)中涉及的交互處理、多模態(tài)輸入、多模態(tài)輸出等維度與訊飛 AI 虛擬人交互平臺長期聚焦的技術(shù)路徑高度契合。科大訊飛自主研發(fā)的星火大模型為數(shù)字人提供了更深層次的認(rèn)知理解能力;在語音合成與識別、自然語言處理等核心領(lǐng)域的多年深耕,則為實(shí)現(xiàn)自然流暢的人機(jī)交互奠定了堅(jiān)實(shí)基礎(chǔ)。這些技術(shù)能力,為其參與國際標(biāo)準(zhǔn)討論與制定提供了重要的技術(shù)積累。
實(shí)踐驗(yàn)證:平臺能力獲得行業(yè)認(rèn)可
技術(shù)價值需要通過市場來檢驗(yàn)。此前,科大訊飛的 AI 虛擬人交互平臺通過了中國信通院人工智能研究所組織的大模型數(shù)字人基礎(chǔ)能力分級測試,并獲得最高等級 L5 認(rèn)證,也進(jìn)一步證明了訊飛 AI 虛擬人交互平臺技術(shù)方案的先進(jìn)性與成熟度。

2 多場景落地應(yīng)用,秀出真本領(lǐng)
將深厚的技術(shù)積累轉(zhuǎn)化為成熟、可用的產(chǎn)品能力,是科大訊飛主導(dǎo)數(shù)字人國際標(biāo)準(zhǔn)制定工作的重要基礎(chǔ)。訊飛 AI 虛擬人交互平臺與移動數(shù)字人等產(chǎn)品,構(gòu)建了覆蓋云端與終端、軟硬一體的全方位數(shù)字人解決方案體系。
在產(chǎn)品能力上,訊飛 AI 虛擬人交互平臺提供虛擬 IP 資產(chǎn)(虛擬偶像、虛擬主播、虛擬角色和虛擬品牌代言人)的構(gòu)建、AIGC內(nèi)容生產(chǎn)(視頻配音、新聞視頻、培訓(xùn)視頻和廣告視頻等)、多模態(tài)交互等軟硬件技術(shù)和產(chǎn)品。同時,平臺提供低代碼搭建、多模板選擇及多語義配置,并支持多語種及方言交互,以滿足多樣化交互需求。

移動數(shù)字人則以移動行走的透明屏為載體,支持 360°聲源定位、避障移動導(dǎo)覽,融合多模態(tài)超擬人自由交互解決方案,采用多人交互、手勢識別、視頻理解的多人交互技術(shù)展示,可在指定區(qū)域內(nèi)實(shí)現(xiàn)自主移動與智能講解,為參觀者帶來沉浸式的互動體驗(yàn)。



在應(yīng)用場景上,這些數(shù)字人解決方案已在媒體、教育、企業(yè)營銷、文旅、金融、政務(wù)等多個行業(yè)成功應(yīng)用。跨行業(yè)、多形態(tài)的成功落地經(jīng)驗(yàn),不僅驗(yàn)證了訊飛 AI 虛擬人交互平臺技術(shù)方案的普適性與創(chuàng)新性,也為數(shù)字人產(chǎn)業(yè)的場景拓展與技術(shù)落地提供了可參考的實(shí)踐案例。
深厚的 AI 技術(shù)積累與經(jīng)過市場驗(yàn)證的產(chǎn)品實(shí)踐,為科大訊飛主導(dǎo)數(shù)字人國際標(biāo)準(zhǔn)的制定工作奠定了堅(jiān)實(shí)基礎(chǔ)。此次科大訊飛能夠擔(dān)任數(shù)字人 ITU 國際標(biāo)準(zhǔn)的編輯,既是對其技術(shù)實(shí)力與產(chǎn)業(yè)貢獻(xiàn)的國際級認(rèn)可,也為其在未來更深入地參與全球協(xié)作、貢獻(xiàn)中國方案搭建了更高層次的平臺。
未來,訊飛 AI 虛擬人交互平臺將繼續(xù)深耕數(shù)字人技術(shù),通過「AI + 行業(yè)」專精模型建設(shè),進(jìn)一步提升數(shù)字人的認(rèn)知能力與場景適配能力。
