2025 年以來,生成式 AI 的風潮已經從卷技術,逐漸走向卷應用、但大半年過去了,各行業雖然有不少應用場景出現,但距離企業級 AI 應用的 "iPhone 時刻 " 似乎又離的很遠。
究其原因,一方面是企業內部訓練、微調大模型的數據量遠遠不夠;另一方面,在算力利用率、異構多元算力融合方面,行業仍有一段路要走。
智算行業興起
自從 ChatGPT 問世之后,生成式 AI 成為了全球科技圈熱議的焦點,而作為生成式 AI 底層支撐的智能算力,也迎來了快速增長的時代。據工信部數據顯示,截至 2025 年一季度,中國智算規模已達到 748EFlops,占整體算力規模的 35%,智算已經成為算力增長的核心驅動力。
無獨有偶,IDC 也十分看好中國智算產業發展,IDC 數據顯示,2025 年,中國智能算力規模將達到 1037.3EFLOPS,預計 2028 年將達到 2781.9EFLOPS;中國通用算力規模將達到 85.8EFLOPS,預計 2028 年將達到 140.1EFLOPS,對此,IDC 中國副總裁周震剛曾告訴筆者,從增加趨勢上分析,2023-2028 年,中國智能算力五年年復合增長率預計將達到 46.2%,通用算力預計將達到 18.8%,預計到 2028 年,中國智能算力規模將達到 2781.9EFLOPS,是 2024 年的近四倍。
從數據上不難看出,目前,用戶對于算力的需求,絕大部分的增量將產生在智能算力方面。
從服務器出貨量角度,也可以看出目前智算已經成為算力產業發展的主流趨勢。據 IDC 數據顯示,2024 年全球人工智能服務器市場規模為 1251 億美元,2025 年將增至 1587 億美元,2028 年有望達到 2227 億美元,其中生成式人工智能服務器占比將從 2025 年的 29.6% 提升至 2028 年的 37.7%。
而龐大的需求主要來自生成式 AI 技術和應用的爆發,僅 2024 上半年,中國 GenAI IaaS 市場同比增長 203.6%,市場規模達 52 億元人民幣,占比整體智算服務市場 35.6%。
當生成式 AI 的技術逐漸成熟,業內也在逐漸從 " 卷 " 模型技術,向著 " 卷 "AI 應用的方向出發。在此趨勢下,大模型技術的演進也隨之從預訓練側,向著推理側、后訓練側發展。對此,聯想中國基礎設施業務群戰略管理總監黃山表示,行業的算力需求從預訓練主導轉向了后訓練和推理主導。
此外,在應用層面,AI 已經開始對企業流程進行智能化改造,尤其是在 DeepSeek 問世之后,諸如醫療、生物科學、交通等領域的垂類應用不斷涌現,在應用側對于后訓練、推理的要求會更高," 對于算力產業而言,從應用層到算力層都發生了很大的變化," 黃山進一步指出," 在變化的過程中,應用層、模型層、算力層軟件之間的相互影響很大。"
這種相互作用的影響也推動了智算產業的變革,一方面,智算在自己的 " 賽道 " 內不斷向前發展;另一方面,智算的發展并非孤立存在,智算與超算、通算之間實現 " 超智融合 " 也成為當前算力產業發展的關鍵。
超智融合是關鍵
從宏觀維度看,超智融合不僅能夠充分發揮各類算力的優勢,實現資源的高效利用,更能為解決復雜的科學問題、推動產業升級提供強大支撐。
超算與智算、傳統數據中心之間最大的差別是應用場景不同。超算主要應用于大規模科學計算、工程仿真、氣象預報、生物信息等領域,這些應用需要處理海量數據和高復雜度計算,對計算性能要求極高。
智算則主要應用于人工智能、機器學習、圖像處理、語音識別等領域,這些應用需要快速迭代和優化模型,對計算效率要求較高。而相較于超算、智算而言,傳統數據中心的應用則更加廣泛,包括云計算、大數據分析、企業級應用等。
而超算、智算、通算的融合,也成為了整個算力產業接下來很長一段時間發展的重點方向。具體來看,在算力方面,超智融合可以提升算力效率,降低能耗成本。通過實現超智融合,可根據具體任務需求靈活調度算力資源,避免資源浪費。例如,在氣象預測中,超算提供高性能計算支持復雜模型的模擬,智算進行數據分析和結果優化,通算處理日常業務數據,三者協同提升效率。
在應用方面,超智融合可以推動科學研究與產業創新,為解決復雜的科學問題提供了強大工具。例如,國家超級計算無錫中心的超智融合算力平臺系統,為新藥研發、企業級智能增強系統等提供全棧智能應用計算解決方案。在產業領域,超智融合助力制造業智能化升級。三一重工通過整合通算、智算和超算資源,實現了生產流程的數字化和智能化,產能提升 123%,人員效率提升 98%,單位制造成本降低 29%。
對此,黃山也向筆者介紹了一些聯想在超智融合方面的經驗和案例,他表示,在聯想與北京大學的合作中,雙方共同建設了高性能計算平臺,平臺以聯想開發的模型為底座,采用聯想深騰 X8810 系統,并配置聯想數據中心采用的英特爾至強鉑金處理器,為各學科領域提供大規模數據處理和大規模科學計算的支持。
" 以生命科學研究場景為例,原先需要 15 分鐘才能完成的核磁共振影像結果,通過該平臺的加持,現在僅需 20 秒左右就能完成。" 黃山介紹道。
此外,在與吉利汽車的合作中,聯想和英特爾共同為吉利打造了一套 HPC 集群化解決方案。該方案通過聯想萬全異構智算平臺 HPC 版和英特爾五代至強可擴展處理器,對 " 星睿智算 HPC 集群 " 進行升級,提升了研發效率,縮短了產品迭代周期。" 在多達 5000 個 CPU 的仿真集群中,通過異構算力平臺,融合 HPC 與智算的能力," 黃山進一步指出," 目前,該方案已經落地了超過 19 種仿真應用。"
異構算力融合仍面臨挑戰
超算與智算的融合首先體現在硬件架構的深度重構。傳統超算以 CPU 為核心,側重雙精度浮點運算(FP64),而智算依賴 GPU/TPU 等加速芯片,聚焦半精度(FP16)和整數運算(INT8)。兩者的硬件架構和計算范式存在本質差異。這種架構差異在 AI for Science 場景中形成瓶頸,比如,蛋白質結構預測需要同時處理高精度分子模擬與數據驅動的模型優化。
除此之外,超算的 " 時間復雜度 " 與智算的 " 空間復雜度 " 難以兼容。融合需從芯片設計、存儲網絡到算法層面實現軟硬協同創新,例如通過動態異構資源池化技術解決算力調度問題。所以超智融合目前來看仍是一個比較棘手的問題。
對此,黃山指出,超算與智算的融合,目前還存在一些難點,主要是因為兩種計算模式下,算力調度機制不同,融合調度機制將成為接下來實現超智融合過程中,最需要首先解決的問題。
除此之外,黃山告訴筆者,算法也是實現超算與智算融合發展的一大掣肘," 因為超算與智算的算法也完全不同,在計算過程中,如何將雙方的計算結果結合在一起,進而進行融合計算,也是實現超智融合的難點之一。" 黃山強調道。
而面對超算、智算、通算融合難題,平臺化的解決方案似乎成為了當前狀態下的最優解。以聯想為例,其通過 " 一橫五縱 " 戰略框架構建了覆蓋通用、科學、AI 算力的異構智算平臺——萬全異構智算平臺。黃山表示,萬全異構智算平臺是聯想 AI 方案的整體抓手,通過智算與 HPC 計算硬件方面多年的積累,再加上對于軟硬協同方面的行業 Know-How,提高了算力的利用率,并優化了軟硬件之間的適配度,向上支持模型應用,向下融合異構算力。
在軟件層面,聯想通過萬全異構智算平臺 3.0 實現 HPC 與 AI 框架的無縫銜接。其 AI 編譯優化器采用算子融合與路徑優化技術,降低訓練與推理成本各 15% 以上;專家并行通信算法針對 MoE 架構通信瓶頸,通過計算通信協同優化將推理時延降低三倍,網絡帶寬利用率達 90%。
在硬件層面,聯想通過萬全異構智算平臺持續拓展與國內外知名合作伙伴的長期合作。資料顯示,萬全異構智算平臺 3.0 已實現了對大多數國內芯片實現了兼容,兼容后較傳統 CPU 集群提速 15 倍。
在模型層面,萬全異構智算平臺已經接入了包括 DeepSeek 在內的,目前市面上主流的開源大模型,并且可以針對 MoE、LLM 等不同架構的模型,提供想對應的適配與優化。正如黃山前文所述——萬全異構智算平臺已經成為聯想集團在企業級 AI 落地方面的核心抓手。
而在異構算力平臺及整合大模型能力平臺方面布局不僅是聯想獨有的布局,從市面上常見的軟硬件服務商的布局可以看出,平臺化的軟件產品的與硬件的結合,是當下提升硬件易用性的最優解,圍繞此,神州數碼推出了神州文學平臺、浪潮信息推出了 EPAI 平臺、青云科技推出了 AI 智算平臺 .......
綜合來看,通過平臺化的產品和生態的構建,推進超算、智算,以及通算融合已經是大勢所趨,而超算、智算、通算的融合不僅是技術路徑的選擇,更是 AI 時代的必經之路。通過硬件異構化、軟件協同化、網絡泛在化的技術突破,以及科研、工業、醫療等領域的深度應用,超智融合正在重構計算范式,推動生產力躍升。
未來,隨著內生智能計算系統的成熟,超算與智算的界限將徹底模糊,形成 " 超級智能計算 " 新形態,開啟人類認知與創新的新紀元。
來源:鈦媒體