用戶名: 密碼: 驗(yàn)證碼:

分解云計(jì)算和高性能計(jì)算 (HPC) 基礎(chǔ)設(shè)施中的全光線路交換

摘要:采用透明全光線路交換的光互連結(jié)構(gòu)提供了確定性、線路交換的固定帶寬數(shù)據(jù)路徑,非常適合硬件資源地互連。大幅降低網(wǎng)絡(luò)本身的功耗,顯著降低與數(shù)據(jù)路徑相關(guān)的延遲,以及更好地對(duì)網(wǎng)絡(luò)架構(gòu)進(jìn)行縱向和橫向擴(kuò)展。

  在全光線路交換(OCS)互連的全光網(wǎng)絡(luò)支持下,分解式網(wǎng)絡(luò)為人工智能和機(jī)器學(xué)習(xí)帶來(lái)全新網(wǎng)絡(luò)設(shè)計(jì)。

  云計(jì)算領(lǐng)域的超大規(guī)模企業(yè)和其他高性能計(jì)算 (HPC) 服務(wù)提供商必須構(gòu)建和拓展其計(jì)算平臺(tái),以滿足客戶對(duì)人工智能應(yīng)用的需求,同時(shí)控制資本支出并降低能耗需求。特別是,所需的處理能力已經(jīng)提高了幾個(gè)數(shù)量級(jí)。

  資源分解是降低成本和能耗的關(guān)鍵

  不同于將這些平臺(tái)的構(gòu)建塊緊密地、但不靈活地捆綁在一個(gè)相對(duì)單一的平臺(tái)(如標(biāo)準(zhǔn)服務(wù)器機(jī)箱)中,而“分解”必要的組件或子系統(tǒng)的過(guò)程避免了效率低下和一些關(guān)鍵底層資源利用率不足的風(fēng)險(xiǎn),更重要的是,如果簡(jiǎn)單地 “架設(shè)和堆疊”更多服務(wù)器,則不可避免地出現(xiàn)過(guò)度地能耗。

  在分解式架構(gòu)中,這些資源(CPU、內(nèi)存、存儲(chǔ)、各種形式的加速硬件)使用集成式高速數(shù)字收發(fā)器和基于適當(dāng)傳輸介質(zhì)和交換技術(shù)的專用互連結(jié)構(gòu)進(jìn)行互連,因此實(shí)現(xiàn)了靈活的組合。資源可以相互獨(dú)立地組合和適當(dāng)擴(kuò)展,滿足預(yù)期工作負(fù)載的需求。

  靈活利用資源

  資源分解原理如上圖所示。利用底層細(xì)粒度資源的公共池,所需資源以定制比率捆綁在一起,動(dòng)態(tài)“組合”形成占比靈活的“裸金屬主機(jī)”硬件主機(jī)。在這種情況下,關(guān)鍵構(gòu)建塊是低級(jí)別的資源元素本身,例如 CPU、內(nèi)存、存儲(chǔ)和各種加速器(GPU、TPU、FPGAs)。

  就可訪問(wèn)和可消耗的資源塊的細(xì)粒度,可以定義不同的分解級(jí)別。

  在細(xì)粒度最高的分解形式中,每個(gè)資源塊(例如一組 DRAM、一個(gè) CPU、一個(gè)加速器)都擁有板載硬件,以便于其資源與互連平臺(tái)進(jìn)行必要的高速、低延遲連接。

  細(xì)粒度稍低的資源分解形式與當(dāng)前硬件實(shí)施更加兼容,可被視為促進(jìn)向完全分解平臺(tái)漸進(jìn)過(guò)渡的一種方式。其中包括:覆蓋在分組交換結(jié)構(gòu)上的光互連和改變傳統(tǒng)服務(wù)器的用途。

  疊加在分組交換架構(gòu)上的光互連

  在這種應(yīng)用中,動(dòng)態(tài)互連的計(jì)算資源組件僅限于加速器硬件。通過(guò)單模光模塊,它們可以使用專用光交換結(jié)構(gòu),靈活、直接地與其他主機(jī)中的同類組件互連,該專用光交換結(jié)構(gòu)有效地疊加在包交換網(wǎng)絡(luò)上,這些包交換網(wǎng)絡(luò)已經(jīng)將集群中主機(jī)之間互聯(lián)起來(lái)。

  改變傳統(tǒng)服務(wù)器的用途


  除單獨(dú)對(duì)加速卡進(jìn)行互連外,還可以訪問(wèn)傳統(tǒng)服務(wù)器群中已經(jīng)存在的更多資源,配備專業(yè)的 SerDes 處理硬件和固件以及高密度、高速光收發(fā)器的專用 PCIe 互連卡充當(dāng)機(jī)箱中與 PCIe 連接的計(jì)算資源和光互連結(jié)構(gòu)之間的高性能網(wǎng)關(guān)。

  互聯(lián)結(jié)構(gòu)

  這是一種采用透明全光線路交換的光互連結(jié)構(gòu),該結(jié)構(gòu)提供了確定性、線路交換的固定帶寬數(shù)據(jù)路徑,非常適合硬件資源地互連,否則這些硬件資源將通過(guò)服務(wù)器主板上的專用線路或者PCI Express 等特定總線直連進(jìn)行固定的低級(jí)互連。

  與電交換網(wǎng)絡(luò)相比,它還能夠大幅降低網(wǎng)絡(luò)本身的功耗,顯著降低與數(shù)據(jù)路徑相關(guān)的延遲,以及更好地對(duì)網(wǎng)絡(luò)架構(gòu)進(jìn)行縱向和橫向擴(kuò)展。由于全光交換網(wǎng)絡(luò)對(duì)與分解式資源元素相關(guān)聯(lián)的光收發(fā)器之間的序列化數(shù)據(jù)流量的格式和線路速率具有固有的透明性,因此面為未來(lái)帶寬升級(jí)更加友好。

  POLATIS DirectLight?


  全光交換機(jī)等損耗最低的全光線路交換機(jī)允許用多達(dá)四級(jí)或四級(jí)以上的交換來(lái)構(gòu)建網(wǎng)絡(luò)架構(gòu),同時(shí)保持在使用分解式資源元素的典型光收發(fā)器的光損耗預(yù)算之內(nèi)。

  分解計(jì)算的優(yōu)勢(shì)

  可以靈活快速地組建硬件計(jì)算平臺(tái)

  可將平臺(tái)擴(kuò)展到適合在硬件運(yùn)行的各種工作負(fù)載的可用資源類型的任何大小和比率。

  在運(yùn)行特定工作負(fù)載的過(guò)程中,可以隨資源消耗需求的變化調(diào)整平臺(tái)的大小。

  可以暫時(shí)關(guān)閉不需要的資源,節(jié)省運(yùn)營(yíng)開(kāi)支 (OPEX)。

  借助分解網(wǎng)絡(luò)架構(gòu),運(yùn)營(yíng)商能夠:

  為各種組件構(gòu)建塊選擇一流的供應(yīng)商。

  使用那些僅支持他們所需特定功能的資源。

  根據(jù)需要升級(jí)資源元素的不同類型和/或塊。

內(nèi)容來(lái)自:訊石光通訊網(wǎng)
本文地址:http://huaquanjd.cn//Site/CN/News/2024/08/23/20240823072230917554.htm 轉(zhuǎn)載請(qǐng)保留文章出處
關(guān)鍵字:
文章標(biāo)題:分解云計(jì)算和高性能計(jì)算 (HPC) 基礎(chǔ)設(shè)施中的全光線路交換
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right