行業資訊  /  News

首頁 行業資訊

智算中心互聯:算網協同,構筑智算互聯新底座

發布日期:2025-01-20 14:21:01  瀏覽次數:1969 來源:C114通信網

C114訊 1月20日消息  AI時代已經來臨。大模型等新興AI應用需求海量的算力支撐,一座座智算中心拔地而起,規模龐大的萬卡集群逐漸投入商用。如何更好地實現智算中心互聯,服務AI應用創新發展,業界做了大量研究工作。

1月16日,作為“2025中國光通信高質量發展論壇”的開篇之作,“智算中心互聯:算網協同,構筑智算互聯新底座”線上研討會順利召開,邀約產業鏈專家代表,圍繞智算中心間跨地域、跨層級、跨主體、高可靠的算力協同與調度,以及智算中心互聯關鍵技術等話題展開了深入探討。

智算中心互聯呼喚網絡架構創新

中國信息通信研究院技術與標準研究所所長張海懿表示AI大模型推動智算中心向超萬卡及以上集群發展,智算中心內互聯、智算中心間互聯、智算應用支撐等高質互聯成為關注熱點。

具體而言,為支撐萬億及以上量級參數量大模型訓練,智算中心內互聯需滿足超大規模組網、大帶寬、超低時延、高可用性等需求。為突破電力供應、機房空間等瓶頸,智算中心間互聯成為重要補充,需要通過長距無損、極低故障率的互聯能力來支撐構建分布式智算集群。為支撐多場景、多業務、大流量入算等智算業務,需要長距高可靠、任務式帶寬、高效流量調度。

針對上述需求,產業界已進行了諸多探索。智算中心內互聯方面,相關片間和組網互聯協議技術競相發展,集合通信庫異構兼容或成未來競爭優勢點,大帶寬需求助推高速光模塊迭代加速,線性模塊方案應用持續探索,芯片級光互聯提供高密度低能耗互聯新方案,全光交換組網和連接可靠性成為關注點。

智算中心間互聯方面,大帶寬、低時延和高可靠需求凸顯,智算分布式訓練應用試驗加速探索,干線400G規模部署,城域800G+逐步試驗,G.654.E、空芯光纖燈新型光纖加速助力構建高質量網絡。

智算業務支撐方面,全光接入為用戶提供靈活品質入算,端到端協同管控助力用戶快速入云入算,網絡大模型成為網絡自智邁向L4+關鍵技術。

在鵬城實驗室云腦研究所副所長張士勛看來,智能計算需求的急劇增長引發了大規模算力基礎設施建設熱潮,如何構建適用于大規模算力基礎設施的網絡架構是關鍵挑戰。當前,業界對智能計算網絡架構的探索呈現出多元化的發展態勢,而基于原始需求,性能、可擴展性、成本、可靠性與可維護性、以及可演進性始終是網絡架構選型的核心考量因素。

方案創新,構建高品質智算網絡

中國移動研究院副院長段曉東表示,如何將分布式部署的智算中心進行協同調度,充分發揮算力資源的最大效能,是業界亟需研究的關鍵問題。為此,中國移動原創提出無損智算OTN( Hitless intelligent computing OTN,HIC-OTN),從超大帶寬、超高可靠、超低時延三方面構建面向智算中心的新型OTN技術體系。

據了解,中國移動在全球運營商最大單集群智算中心(哈爾濱數據中心)基于無損智算OTN(HIC-OTN)完成首個104km跨智算集群PP拉遠訓練現網技術試驗,探索和驗證了百公里級跨集群PP訓練的可行性。

打造高品質智算網絡的過程中,作為在業界最早提出“云網融合”理念的運營商,中國電信認為云網融合下算力和網絡的發展途徑也開始有了新的變化,云網融合也隨之邁入云網融合3.0新階段。中國電信研究院副院長傅志仁介紹,算力發展核心逐步變化成構建以GPU為核心的智算集群,網絡的發展核心逐漸變化成基于智算架構的新型網絡,向AI native Network演進。

目前,中國電信圍繞云網融合3.0底座,在運力、算力、存力,以及算網融合、存算融合的云網融合底座、數據和底座融合、大模型和底座融合、應用和底座融合方面進行了一系列布局,并實現智算能力、創新環境、應用場景開放,賦能千行百業,推動數字經濟發展。

中國聯通研究院副院長/首席科學家唐雄燕介紹,為了更好地支撐智算互聯的需要,2024年,中國聯通正式發布算力智聯網AINet,通過IP+光融合打造新質運力,實現算力服務與網絡服務協同,構建算力互聯網的新底座。

AINet具備三個重要特征,即“三高”核心能力,分別是高通量、高性能、高智能。唐雄燕表示,光網絡是構建AINet“三高”能力的關鍵底座。AINet部署了雙平面立體組網的400G ROADM全光智算網絡,同時部署了智算網關,實現網絡與智算的高效連接。

騰訊光網絡架構師李方超表示,隨著算力網絡的規模化發展,大模型訓練與推理應用的持續增長與園區物理資源擴展受限的矛盾愈發顯著,在此背景下騰訊協同多家用戶與合作伙伴一起推動Mega Scale Out項目,目標是解決園區內和跨園區擴展兩個層面的關鍵問題與核心能力。

產業引領,助推智算互聯高質量發展

AI大模型的算力增長以每年10倍的速度持續擴張,對芯片間的光互聯帶寬提出了極為苛刻的要求。在眾多光芯片技術中,硅光芯片憑借其獨特的優勢脫穎而出,承載著數據中心高速光互聯的技術優勢。

蘇州海光芯創光電科技股份有限公司首席科學家陳曉剛介紹,硅光產業鏈條中封測產能是關鍵瓶頸,為推動硅光芯片量產化發展,Fabless 2.0 在封測段提出Standard(標準化),Simplified(簡單化)、Scalable(規模化)、Shared(多平臺共享)四項需求。

也是隨著AI智算中心高速光互聯速率的提升,光模塊功耗不斷增加。東莞立訊技術有限公司產品經理周小丹介紹,在200G到800G時代,采用PAM4調制,功耗就從4W增加到16W;來到1.6T時代,功耗約是在30W。同時,光模塊功耗的持續上升,也給系統散熱能力帶來了挑戰。

針對這一挑戰,立訊技術提供了包括DPO、LRO和LPO等多種AI低功耗的解決方案。周小丹透露,立訊科技推出的多款低功耗AI光互聯解決方案,已經和業內頭部的交換機服務器廠商進行了小批量驗證,無論是帶寬速率、功耗、誤碼率還是兼容性等方面,都完全滿足最終用戶需求。

“2025中國光通信高質量發展論壇”是由CIOE中國光博會與C114通信網聯合推出的大型研討會系列活動,通過多場專題論壇、線上研討會、閉門研討會等形式,聚焦產業鏈薄弱環節,瞄準技術未來演進方向,發掘熱點應用場景,群策群力,貢獻行業價值,進一步助力我國光通信產業高質量發展。

下一場論壇將于2月27日上線,主題為“FTTR-B:賦能垂直行業數字化轉型”,探討FTTR如何在政企領域實現數字化轉型,如何在中小微企業全光內部組網靈活部署,如何解決傳統網絡架構的帶寬瓶頸和覆蓋難題。

上一篇: 投資數百億元,字節跳動算力中心盤點

下一篇:智算中心高質互聯成為智算應用關注熱點

業務
咨詢

客服熱線

客服
熱線

7*24小時服務熱線

18986158343
7*24小時服務熱線

關注微信

關注
微信

微信二維碼 關注官方微信
返回頂部 頂部