2025年10月28日,由中國人工智能學會組織的“多模態數字專家關鍵技術及產業應用”科技成果鑒定會在北京舉行。經專家委員會嚴格評審,云知聲研發的“多模態醫療垂類大模型”“芯上端側小模型精煉化”和“多模態情智兼備數字人”三項技術成果,均達到“國際領先”水平。

鑒定會現場
本次鑒定會匯聚了人工智能領域的頂尖專家力量,鑒定委員會由中科院自動化所副所長、中國人工智能學會副理事長劉成林擔任主任,加拿大工程院外籍院士梅濤擔任副主任,聯合其他6位領域內權威專家共同組成。專家組通過聽取技術報告、觀摩成果演示、審閱檢測資料,并經過多輪深入質詢與論證,最終形成鑒定意見。整個評審過程嚴謹規范,充分體現了認證的權威性與公信力。
在科技創新領域,“國際領先”“國際先進”“國內領先”“國內先進”四大等級是衡量科技成果技術水平的核心標準。其中,“國際領先”作為最高評價等級,代表該項技術在全球相應領域具備突破性創新,能夠填補國際技術空白,且在核心技術指標、實際性能與應用效果上,均顯著優于國際同類技術。此次云知聲三項技術同時斬獲這一頂級認證,不僅是對企業長期技術研發投入與創新能力的高度肯定,更標志著公司在人工智能領域取得重要突破。

多模態醫療垂類大模型
“多模態醫療垂類大模型”基于云知聲通用大模型(山海大模型)孵化而成,實現了對醫學文本、影像(包括X光片、CT、病理切片等)多源異構信息的深度融合與統一理解生成。該模型依托海量、多源、異構的醫學數據(涵蓋文獻、研究、臨床記錄及知識庫)進行深度預訓練,通過精細化數據處理技術自動識別優質圖文數據,并運用多模態分析評估圖文匹配度,成功構建了包含數億條高質量圖文數據的訓練體系。在此基礎上,創新性地融合了持續學習機制(增量訓練)與知識檢索增強(RAG)等先進知識注入范式,利用跨模態語義對齊技術不斷完善模型能力。
在實際醫療業務場景中,該模型已具備病歷生成、醫學報告生成、病歷質控及影像報告質控等多項業務落地能力。在肝局灶病變良惡性檢測任務中,模型準確率突破90%,為臨床鑒別診斷提供了高度可靠的AI支持。同時,該模型在多項權威評測中表現卓越:不僅斬獲CCKS2023-PromptCBLUE醫療大模型評測A、B榜雙料冠軍,在臨床執業醫師資格考試中更取得523分(滿分600分)的優異成績,大幅超越人類考生平均分(365分)。在2025年5月最新發布的MedBench評測榜單中,云知聲山海大模型醫療深度思考版(UniGPT-Med-U1)以綜合得分93.1分蟬聯冠軍,并在醫學語言理解與醫學安全倫理兩個專項評測中分別以122.3分和104.9分的佳績雙雙登頂,展現出卓越的技術領先性。
在實際醫療業務場景中,該模型已具備病歷生成、醫學報告生成、病歷質控及影像報告質控等多項業務落地能力。
芯上端側小模型精煉化
“芯上端側小模型精煉化”技術聚焦小樣本持續學習、低資源快速解碼、小參數模型增強與低比特模型量化等關鍵技術路徑,系統性地推進AI模型輕量化與效能優化。該技術使大模型能在端側芯片上高效穩定運行,在低功耗、低算力的實際工況下,充分滿足高準確率與高實時性的推理要求。
面向個性化輕量級交互控制需求,該技術提出多種邊緣計算端側部署優化方法,突破性解決了傳統端側模型效果差、解碼速度慢等行業痛點。在保持與大模型相當交互效果的同時,成功將模型資源消耗降低百倍以上,顯著提升運行效率。
多模態情智兼備數字人
“多模態情智兼備數字人”由云知聲與中國科學技術大學於俊副教授團隊聯合研發。該技術基于創新的“矛+盾”設計思想,在真實感與人機交互能力上實現重要突破。該技術通過設計全局與局部結合的自我交互注意模塊,提出多模態數據對齊與視頻無損渲染算法,并構建了語音內容與面部動作特征分離的音視頻解耦訓練框架。同時,團隊建立了兼顧外部表觀與內部器官的人體全周三維重建體系,充分融合人類生理特性與統計學習方法,構建出高真實感的合成模型;通過完善音視頻同步的發音可視化系統,實現了從語音特征到人體器官參數的精準預測,進而達成人體動作與器官狀態的視聽覺協同表達與跨模態內容生成。基于解剖學精細的內外透視化三維人體合成技術,有效解決了當前數字人技術中普遍存在的動態表現真實感不足、內外結構割裂及缺乏生理關聯等核心難題,最終創造出能說會唱、內容豐富、力度多變、行為自然且情感充沛的高保真數字人。該成果可應用于在線客服、虛擬助手、教育培訓等多種場景。
在通用人工智能(AGI)浪潮重塑全球產業格局的背景下,專業級“數字專家”正成為推動各行業生產力躍遷的關鍵引擎。全球特別是中美產業變革競爭加劇,數字專家將引領各行業的生產力變革,成為中美戰略競爭的關鍵。
作為國內AGI技術產業化的先驅者之一,云知聲率先把握戰略機遇,打通“技術-場景-數據”閉環,構建專業級大模型及智能體,有效整合專業知識、聚焦關鍵問題,通過行業知識增強和強化學習,致力于專業級大模型構建,推動生產力變革。
通過打造“通用底座-專業智能體-端側芯片優化-Atlas基礎設施”的四層技術架構——通用大模型覆蓋廣度,專業智能體攻克深度,端云協同實現規模化,基礎設施保障進化效率,從智慧生活、醫療、保險、交通等領域切入,為這些垂直行業打造數字專家,形成AI大模型時代的差異化競爭優勢及行業壁壘。
加上之前的“AI語音自由說技術”,截至目前,云知聲已經在四項關鍵技術上獲得了“國際領先認證”,全面覆蓋語音技術、芯片、醫療大模型、數字人技術四大關鍵賽道,這些成果既筑牢了底層技術根基,也打通了從技術研發到場景落地的完整閉環,為云知聲“打造數字專家,引領產業變革”提供了更加強勁的動力!
未來,云知聲將繼續深化“技術-場景-數據”閉環,持續推動AGI技術的迭代演進。通過拓展技術上限與應用邊界,加速商業化落地進程,致力于將前沿技術創新轉化為實際生產力,在持續推動產業智能化升級的同時,為中國在全球人工智能競爭中貢獻更多突破性成果。
