在人工智能(AI)與移動計算深度融合的背景下,邊緣計算逐步成為新一代智能服務基礎架構的核心。在這一浪潮中,微算法科技推出一種具有批處理功能的邊緣服務器實現多用戶協同推理技術,這項技術不僅提供了面向多用戶、能耗敏感型設備的高效協同推理解決方案,還通過創新的批處理調度與任務劃分算法,打破傳統推理模式的限制,顯著提升GPU資源利用率與系統整體吞吐能力。
在當前邊緣智能化的大趨勢下,移動終端設備的AI應用越來越豐富,從智能安防、增強現實,到車載AI助手,幾乎無處不在。然而,這些終端設備往往受限于能耗與計算能力,難以獨立高效完成深度神經網絡(DNN)推理任務。尤其是在并發任務數量劇增的場景中,單設備完成所有計算將造成電量快速消耗和響應速度下降。因此,推理任務卸載成為緩解這些瓶頸的重要方向。將深度學習模型的推理階段卸載至配備GPU的邊緣服務器,不僅能釋放終端計算資源,還可在保持較低延遲的同時提供近實時服務。
但傳統卸載方案通常針對單用戶場景,未充分考慮多個用戶共享邊緣服務器資源時的任務調度與負載均衡問題。在真實世界中,邊緣服務器往往要同時響應數十、甚至數百個終端設備的推理請求。在這種多用戶同時在線的場景下,如何高效地調度任務,最大限度地提升GPU并行計算能力,并在保障各用戶延遲需求的同時最小化整體能耗,成為亟需解決的問題。
因此,微算法科技提出了一種創新架構:將用戶推理任務進一步拆分為多個細粒度的子任務,并利用GPU的批處理能力對多個用戶的相同類型子任務進行統一聚合處理。這一思路源自于對GPU執行特性和神經網絡推理結構的深入分析。在DNN模型中,推理通常由若干層組成,不同用戶即便使用不同模型,也常存在可重用的結構(如卷積層、全連接層等),因此可以通過統一調度與分組機制,對同類任務進行并發批處理,從而提高資源利用率。
在系統設計方面,微算法科技研發團隊引入獨立劃分與相同子任務聚合算法(Independent Partition and Same Subtask Aggregation,IP-SSA)技術。該算法的核心理念是:對于具有相同邊緣推理延遲與相同服務級別協議的多用戶群體,可將每個用戶的推理任務獨立劃分為子任務,并將相同類別的子任務聚合在一個批次中處理。通過嚴格的理論推導,研究團隊證明了這一策略在延遲恒定約束條件下是最優的。也就是說,在限定的響應時間內,IP-SSA 能夠最小化總能耗并提升系統吞吐率,從而為批處理系統提供堅實的理論支撐。
然而,真實應用中用戶請求的時延容忍度通常存在差異,特別是在服務等級協議(SLA)各異的情況下,這種差異可能導致傳統聚合策略效率下降。為解決該挑戰,微算法科技進一步提出了最優分組算法(Optimal Grouping,OG)。OG算法通過對用戶任務的延遲上限、任務計算強度和資源可用性建模,動態調整任務分組方式,確保在多樣化時延約束下,任務依舊能高效進行批處理。這一算法不僅保留了IP-SSA的高并發調度能力,還能靈活適應不同的服務場景。

為適應動態場景下任務到達的不確定性,微算法科技還在系統中引入了強化學習模型進行調度決策。通過訓練深度確定性策略梯度(Deep Deterministic Policy Gradient,DDPG)代理,系統能夠在運行中自適應學習最優調度策略。具體來說,當預測模型無法精確獲得未來任務分布時,DDPG代理根據當前狀態選擇是否使用OG算法進行任務分組,或選擇直接按照任務類型即時調度。此機制大幅提升了系統的魯棒性與在線部署適應能力。
微算法科技該系統的核心包括三大模塊:任務劃分模塊、任務聚合與分組模塊,以及調度策略優化模塊。任務劃分模塊將原始DNN模型轉換為可卸載的子任務圖,并結合端設備的功耗模型進行代價建模;任務聚合與分組模塊利用IP-SSA和OG策略,根據任務特征和延遲需求進行批處理組織;而調度策略優化模塊則通過強化學習驅動的控制器進行在線調度,從而在實際運行中持續優化資源利用與服務質量。
系統在多個邊緣計算實驗平臺上進行了測試,分別對圖像識別與目標檢測實驗,覆蓋智能攝像頭、移動終端、智能車載設備等典型場景。結果表明,與傳統推理卸載系統相比,該系統在保持推理精度的前提下,實現了平均47.8%的能耗下降,并提升了42.5%的任務吞吐量。在多用戶并發數大于50的場景中,系統仍能維持穩定的延遲控制能力,有效避免了因GPU任務擁塞帶來的性能下降。
此外,微算法科技該系統支持多種部署模型,包括本地私有邊緣云、區域型MEC(移動邊緣計算)平臺、以及融合5G網絡的邊緣服務節點。這種靈活部署能力,使其可廣泛應用于智能制造、智能城市、智慧醫療等對響應時間與能效有嚴格要求的行業中。
微算法科技計劃將該系統進一步擴展為通用的AI卸載平臺,支持多模態數據協同推理任務(如圖像、語音、文本融合分析),并與邊緣數據緩存系統集成,實現“感知—分析—執行”一體化AI服務。此外,系統的調度核心也將在聯邦學習與安全多方計算框架下進行強化,以適應更高等級的隱私保護和數據隔離需求。
作為邊緣AI領域的重要突破,微算法科技這項具有批處理功能的邊緣服務器實現多用戶協同推理技術,不僅是算法與系統工程的深度融合,更為邊緣智能生態帶來一套系統化的性能優化方案。在全球AI應用場景爆發增長的今天,這項技術將引領新一代邊緣智能基礎設施的建設潮流,為構建更加綠色、高效、智能的計算未來提供堅實支撐。
