ICC訊(編譯:Nina)Cignal AI與系統(tǒng)和器件供應(yīng)商進(jìn)行了兩個(gè)月的交談,了解了他們對(duì)下一波100Gbps和200Gbps基于PAM4客戶端光學(xué)的想法。Cignal AI在光器件報(bào)告中提供了800Gbs和1.6Tbs光模塊的完整定量預(yù)測(cè),但該分析公司希望分享一下他們?cè)谶@些數(shù)字背后的觀察和想法,以幫助客戶了解數(shù)據(jù)中心內(nèi)的下一波速度:
- 光器件在進(jìn)度和接口速率方面都遵循芯片的能力,因此要根據(jù)芯片進(jìn)度來確定光器件進(jìn)度。
-
800GbE將于明年開始大規(guī)模部署,1.6TbE和3.2TbE將在未來2-3年內(nèi)部署。
-
關(guān)于QSFP和OSFP的爭(zhēng)論要得出結(jié)論還為時(shí)過早,在更高的速率下,熱管理將是更難解決的問題之一。
-
有一些努力(但不是很多)致力于用新的高速PAM4速率升級(jí)低速客戶端光學(xué)器件。
當(dāng)前一代400GbE客戶端光學(xué)器件構(gòu)建在到交換機(jī)結(jié)構(gòu)、GPU和其他硅芯片組的每通道50Gbps PAM4電連接上。業(yè)內(nèi)正在構(gòu)建基于每通道100Gbps PAM4的下一代800GbE模塊,同時(shí)已經(jīng)演示了200Gbps PAM4組件。隨著電速率的增加,有更多的高速客戶端光學(xué)以及升級(jí)到低速客戶端光學(xué)的選擇。
100Gbps和200Gbps PAM4概述
目前的400GbE模塊使用8個(gè)56Gbps PAM4(通常簡(jiǎn)稱為50Gbps)電氣連接通道來提供完整的400Gbps數(shù)據(jù)。在大多數(shù)400GbE模塊中,這些56Gbps的電氣通道連接到單獨(dú)光纖(例如DR4)或波長(zhǎng)(例如FR4)上的四個(gè)112Gbps光通道。
-
標(biāo)準(zhǔn)的QSFP-DD(有時(shí)稱為QSFP56-DD)被設(shè)計(jì)為具有8個(gè)56Gbps信號(hào)通道。DD,即雙倍密度,意味著該模塊的信號(hào)路徑(8)是標(biāo)準(zhǔn)QSFP(4)的兩倍。
-
具有四個(gè)56Gbps信號(hào)通道的QSFP56模塊也適用于200GbE模塊,并且廣泛可用。業(yè)內(nèi)還定義了支持100GbE的2x56Gbps信號(hào)的SFP-DD112,但其受歡迎程度要低得多。
-
廣泛部署的QSFP28標(biāo)準(zhǔn)為100GbE模塊提供4路28Gbps信號(hào)。
112Gbps PAM4(通常簡(jiǎn)稱為100Gbps)使每種模塊類型的可用速度翻了一番。支持112Gbps PAM4的新模塊不僅可以支持更高的速度,還可以滿足與更高速度相關(guān)的更高功率要求。例如,QSFP-DD的原始規(guī)格是14W,盡管在實(shí)踐中接近20W。112Gbps版本規(guī)格從25W開始,一些供應(yīng)商已經(jīng)瞄準(zhǔn)了30W的能力。
224Gbps PAM4(通常簡(jiǎn)稱為200Gbps)將速度再次提高一倍,最終支持每個(gè)模塊高達(dá)1.6Tbps或3.2Tbps。為了支持這些更高的速率,業(yè)內(nèi)將需要開發(fā)具有改進(jìn)散熱的新模塊類型(例如,OSFP-XD)。
支持800GbE模塊的112Gbps組件已經(jīng)成熟,基于該技術(shù)的模塊的早期版本在今年3月的OFC22和9月的ECOC22上進(jìn)行了演示。
224Gbps的PAM4還處于早期開發(fā)階段。在OFC22上,Coherent展示了其224Gbps EML, Semtech展示了200Gbps TIA和驅(qū)動(dòng)器,許多供應(yīng)商暗示了他們的224Gbps組件和模塊計(jì)劃。
100Gbps PAM4模塊
最受歡迎的112Gbps模塊肯定是QSFP-DD800,設(shè)計(jì)用于8x112Gbps操作,以提供800GbE。然而,每通道112Gbps的PAM4也可以應(yīng)用于低速模塊。例如,SFP112被定義為使用112Gbps PAM4輸入和輸出來支持單個(gè)100GbE波長(zhǎng),而當(dāng)前SFP最大速率為10-25Gbps。齒輪箱(Gearboxing)——或者使用額外的邏輯從較低的電氣速率轉(zhuǎn)換為較高的光學(xué)速率——通常是避免的,因?yàn)樗黾恿四K的成本和功率。
支持112Gbps PAM4接口的最新交換機(jī)硅在設(shè)計(jì)時(shí)考慮到了800GbE,使用這些芯片組構(gòu)建的初始硬件將支持最高密度的800GbE。因此,光模塊制造商的主要關(guān)注點(diǎn)是QSFP-DD800模塊。初始版本將是2x400GbE(2xFR4)和一些8x100GbE,這兩種版本都允許更大的Breakout密度,并避免了IEEE定義800GbE MAC時(shí)的延遲。單接口800GbE設(shè)備將緊隨其后,數(shù)據(jù)中心內(nèi)部使用的較短距離(500m/2km)DR8跨度是最高優(yōu)先級(jí)。
至少有一家硬件供應(yīng)商也計(jì)劃為低速模塊(QSFP112和SFP112)構(gòu)建接口。該供應(yīng)商的重點(diǎn)是服務(wù)提供商(而不是數(shù)據(jù)中心運(yùn)營(yíng)商)的100GbE速度,他們?nèi)匀徽J(rèn)為城域?qū)?00GbE和400GbE的需求很大。具有單個(gè)112Gbps PAM4輸入和輸出的100GbE模塊的功率將比4通道版本低得多,并且可以與最新的交換機(jī)芯片互連,而無需齒輪箱。將100GbE接口轉(zhuǎn)換為更小的SFP格式還可以減少前面板空間和支持該接口所需的設(shè)備尺寸。
專注于數(shù)據(jù)中心運(yùn)營(yíng)商的硬件供應(yīng)商不會(huì)構(gòu)建基于112Gbps接口的低速(100GbE、400GbE)模塊。大型數(shù)據(jù)中心運(yùn)營(yíng)商正在從100GbE遷移到400GbE,他們認(rèn)為更新網(wǎng)絡(luò)中已經(jīng)被限制的舊設(shè)備沒有任何好處。目前正在部署的400GbE模塊(8x56Gbps)旨在與當(dāng)前的交換機(jī)芯片對(duì)接,這兩種芯片的部署量仍在增加。這些運(yùn)營(yíng)商將等待幾年后推出的下一代1.6TbE模塊(8x224Gbps或16x112Gbps),而不是使用新的4x112Gbps模塊和新的交換機(jī)硅重啟這一進(jìn)程。
基于OSFP-XD規(guī)范的112Gbps接口還將支持首批1.6TbE模塊。OSFP-XD旨在支持16條信號(hào)通道,目標(biāo)是支持1.6TbE,最終支持3.2TbE。
200Gbps PAM4模塊
224Gbps PAM模塊定義尚處于早期階段,但224Gbps PAM的最終目標(biāo)是支持3.2TbE(16x224Gbps)。QSFP224模塊已被定義為支持800GbE,但它可能與QSFP112支持400GbE屬于同一類別,實(shí)際部署有限。QSFP格式的支持者樂觀地認(rèn)為,QSFP-DD800模塊的一個(gè)版本可以設(shè)計(jì)為支持1.6TbE(8x224Gbps),但這項(xiàng)工作尚未正式開始。
QSFP vs OSFP
QSFP和OSFP格式在模塊供應(yīng)商、硬件供應(yīng)商和運(yùn)營(yíng)商中都有支持者。QSFP一直是高達(dá)400GbE速率的銷量冠軍,OSFP方面僅有谷歌大規(guī)模部署了,但這可能會(huì)在未來幾代發(fā)生變化。
也許兩種格式之間最大的區(qū)別是散熱片的位置。在OSFP上,散熱器內(nèi)嵌在模塊中。在QSFP上,散熱片位于硬件板上–籠子(Cage)或設(shè)備中。
嵌入式散熱器在技術(shù)上是一個(gè)更好的解決方案,因?yàn)樵O(shè)計(jì)師不必?fù)?dān)心與外部散熱器的熱連接,設(shè)計(jì)更加集成等。然而,嵌入式解決方案是固定在它們?cè)O(shè)計(jì)的位置上的。例如,最初的OSFP設(shè)計(jì)假設(shè)為12W,但現(xiàn)在提出的解決方案將需要30W,這需要更高的氣流和更大的風(fēng)扇功率。
板載散熱器具有更大的靈活性。例如,板載散熱器可以用不同材料設(shè)計(jì)不同的翅片輪廓等,以更好地最大化散熱。因此,基于QSFP的高功率設(shè)計(jì)通常需要更少的氣流和更少的風(fēng)扇功率。一家供應(yīng)商聲稱,在他們的系統(tǒng)中,與OSFP設(shè)計(jì)相比,系統(tǒng)功耗節(jié)省了20%。
然而,隨著功耗成為一個(gè)更大的問題,QSFP由于尺寸較小,可能不具備外部散熱器去除所有熱量的能力。OSFP-XD設(shè)計(jì)更大,同時(shí)包含內(nèi)部和外部散熱器,既簡(jiǎn)單又適合未來。
QSFP與OSFP相比具有其他優(yōu)勢(shì),這些優(yōu)勢(shì)為其迄今為止的成功做出了貢獻(xiàn)。它是向后兼容的,因此當(dāng)前的解決方案可以與上一代(和下一代)兼容。外部散熱器也可以實(shí)現(xiàn)這一點(diǎn),因?yàn)閯?chuàng)新的散熱器設(shè)計(jì)可以適應(yīng)下一代更高的功率。QSFP也小于OSFP,因此可以安裝在面板上的單元數(shù)量更高。通常,路由器設(shè)計(jì)者更喜歡QSFP,即使他們支持兩種模塊類型,但大多數(shù)人承認(rèn)QSFP可能會(huì)在1.6Tbps時(shí)迎來終結(jié)。
發(fā)布時(shí)間表
交換機(jī)芯片的發(fā)布時(shí)間表決定了下一波客戶端光學(xué)器件的需求。目前大多數(shù)客戶端光學(xué)器件都部署在路由器中,而客戶端光學(xué)器件需要路由器硬件。(客戶端光學(xué)器件也部署在服務(wù)器、AI/ML節(jié)點(diǎn)和其他硬件中,但這些硬件通常落后于路由器部署。)一般的開發(fā)計(jì)劃要求客戶端光學(xué)器件在交換機(jī)芯片組首次到達(dá)之前可用,以便進(jìn)行測(cè)試和集成到完整的系統(tǒng)中。但在系統(tǒng)進(jìn)入批量生產(chǎn)之前,這仍然需要一年的時(shí)間。
基于112Gbps的光學(xué)器件(800GbE)的芯片組目前已在實(shí)驗(yàn)室中,這意味著少量800GbE光學(xué)器件已交付給系統(tǒng)供應(yīng)商進(jìn)行集成測(cè)試。系統(tǒng)部署計(jì)劃在2023年上半年進(jìn)行,但要到2023年下半年才會(huì)進(jìn)行大規(guī)模部署。Hyperscaler的一些白盒開發(fā)可能會(huì)稍早一些,但沒有人能逃脫交換機(jī)芯片組的時(shí)間限制。
一些800GbE接口已交付給AI/ML專有系統(tǒng),但這些系統(tǒng)使用定制齒輪箱將AI/ML芯片組的56Gbps PAM4信號(hào)升級(jí)到112Gbps。由于這些不是真正的800GbE模塊,而是定制的接口,因此它們不計(jì)入Cignal AI的800GbE模塊出貨量中。
基于224Gbps的光學(xué)系統(tǒng)預(yù)計(jì)將比基于112Gbps的光學(xué)系統(tǒng)晚18至24個(gè)月,這意味著部署要到2025年。
結(jié)論
了解下一波客戶端光學(xué)技術(shù)背后的技術(shù)和路線圖對(duì)于路由器硬件供應(yīng)商以及制造支持最新速率的轉(zhuǎn)發(fā)器和復(fù)用轉(zhuǎn)發(fā)器的光學(xué)硬件供應(yīng)商至關(guān)重要。Cignal AI要感謝所有為本報(bào)告提供全面和深入信息的供應(yīng)商和運(yùn)營(yíng)商。
原文鏈接:Previewing 800/1.6Tbs Client Optics - Cignal AI - https://cignal.ai/2022/10/previewing-800-1-6tbs-client-optics/