99热都是精品|亚洲精品精华液一区|日本综合视频|wallpaper原神18进入|国产农村一国产农村|穿越火线 兰|寡妇的肉体完整版

媒體界 - 推動中國媒體行業創新,促進業內人士交流分享!

F5中國推出TBLB方案:以Token為核心,破解異構算力調度難題提效能

   發布時間:2026-06-05 14:37 作者:馮璃月

在AI大模型推理從實驗室走向大規模應用的關鍵階段,如何高效調度異構算力資源成為行業焦點。應用交付與安全領域頭部企業F5中國近日宣布,推出全球首個基于詞元(Token)的負載均衡解決方案(TBLB),通過重新定義算力調度邏輯,為AI推理場景提供更精準的資源分配方案。該方案已在汽車、金融、通信等多個行業完成驗證,實測顯示可在不增加硬件投入的情況下,將GPU利用率提升最高60%,端到端響應速度提升近50%。

傳統負載均衡技術誕生于互聯網時代,主要依據連接數或請求數進行流量分配。但隨著大模型推理進入高并發階段,這種"平均分流"模式暴露出明顯短板。F5中國區產品負責人指出,在AI場景中,單個請求的計算量可能相差百倍,真正消耗GPU資源的并非請求數量,而是Token規模、上下文長度及推理復雜度。特別是在中國特有的異構算力環境中,企業常混合部署NVIDIA、華為、阿里等不同廠商的GPU,傳統方案難以準確感知底層算力狀態,導致部分節點過載而其他節點閑置。

TBLB方案的核心突破在于構建了"算力感知"調度體系。該方案通過實時采集Token數量、GPU負載、KV Cache狀態、任務隊列長度等12項關鍵指標,運用動態權重算法調整請求分配策略。例如在汽車行業客戶案例中,由6塊A40與8塊L20組成的混合算力集群,在部署TBLB后,Token生成速度提升30.3%,端到端響應時間縮短48%,且未產生任何額外硬件成本。通信運營商采用華為Ascend 910B的測試環境顯示,并發用戶數提升75%,Token處理效率近乎翻倍。

這種技術革新正推動行業基礎設施邏輯發生根本轉變。F5北亞區總裁黃彥文強調,AI競爭已從單純的模型參數比拼,延伸至推理環節的資源調度效率。當前GPU迭代周期縮短至12-15個月,企業面臨巨大的資產折舊壓力,提升現有設備利用率成為關鍵。TBLB方案支持跨品牌、跨代際GPU的統一調度,經實測可將混合算力集群的整體利用率提升60%,有效延長硬件生命周期。

值得關注的是,這項源于中國實踐的創新正在走向全球舞臺。F5已成立專門的AI應用工程部,將TBLB的核心調度算法與全球客戶場景深度融合。黃彥文透露,雖然創新發端于中國市場,但"Token中心化"的調度理念已獲得國際認可,成為AI基礎設施演進的重要方向。這種技術輸出與本土創新的雙向互動,印證了中國在AI工程化領域的領先地位。

在戰略布局層面,F5中國將業務航道升級為"本地AI賦能"與"支持企業出海"雙輪驅動。一方面圍繞智能原生應用構建本地化能力中心,另一方面針對新能源汽車、高端制造等優勢產業的全球化需求,提供覆蓋多云環境的應用交付與安全解決方案。這種轉變既體現了技術供應商的角色升級,也折射出中國AI產業從應用創新向基礎技術輸出的路徑演進。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新