注:本文根據(jù)2018年5月ODCC數(shù)據(jù)中心光網(wǎng)絡(luò)技術(shù)大會(huì)耿競(jìng)一(騰訊高級(jí)網(wǎng)絡(luò)架構(gòu)師)演講內(nèi)容整理。
ICCSZ訊 IPOC(IP Optical Convergence,IP與光融合)是騰訊城域互聯(lián)的重要技術(shù)路線,100G非相干彩光方案也是基于此進(jìn)行的設(shè)計(jì)。
IPOC方案在城域網(wǎng)的應(yīng)用,首先要明確騰訊在城域互聯(lián)場(chǎng)景的技術(shù)背景和需求,或者可以歸納為對(duì)超大規(guī)模的分布式數(shù)據(jù)中心之間的城域互聯(lián)的場(chǎng)景分析。
下圖1是騰訊國內(nèi)某核心城市的真實(shí)組網(wǎng)圖,8個(gè)IDC集群園區(qū)之間的Fullmesh連接,每?jī)蓚€(gè)園區(qū)之間都是點(diǎn)到點(diǎn)的光纖互聯(lián),光纖距離小于120公里。
根據(jù)目前的流量規(guī)劃和帶寬規(guī)劃,我們可以看到在未來的2019年,整個(gè)騰訊骨干網(wǎng)的城域部分帶寬建設(shè)量會(huì)達(dá)到300T級(jí)別,并且這個(gè)數(shù)據(jù)是以超過100%的年增長(zhǎng)率持續(xù)增長(zhǎng)。所以騰訊在光傳輸網(wǎng)絡(luò)領(lǐng)域面臨著非常龐大的挑戰(zhàn),即在如此巨大規(guī)模的網(wǎng)絡(luò)下,我們需要構(gòu)建一個(gè)什么樣的方案來解決光傳輸?shù)膯栴}。
這個(gè)問題可以從三個(gè)維度來分析,即運(yùn)維、性能和互聯(lián)場(chǎng)景。
IPOC運(yùn)維需求
目前騰訊在網(wǎng)運(yùn)營的網(wǎng)絡(luò)設(shè)備數(shù)量已超過七萬臺(tái),服務(wù)器已經(jīng)超過一百萬,網(wǎng)絡(luò)運(yùn)營團(tuán)隊(duì)正面臨著海量運(yùn)營的挑戰(zhàn)。因此在方案設(shè)計(jì)和選擇的時(shí)候,運(yùn)營支撐能力的考慮是非常重要的因素之一。
一方面,光傳輸方案做到所有節(jié)點(diǎn)部署操作簡(jiǎn)單,以盡量減小建設(shè)及運(yùn)營的復(fù)雜度。
另一方面,方案需要具備適應(yīng)不同光纖環(huán)境和大規(guī)模靈活拓展能力。傳統(tǒng)的OTN系統(tǒng)多服務(wù)于電信運(yùn)營商,設(shè)備形態(tài)和硬件設(shè)計(jì)包括散熱方式等都是面向傳統(tǒng)運(yùn)營商的機(jī)房,這些設(shè)備對(duì)于分布式數(shù)據(jù)中心機(jī)房而言,需要進(jìn)行電力改造、散熱通道改造、甚至機(jī)架的改造等,會(huì)大大延長(zhǎng)數(shù)據(jù)中心機(jī)房的交付時(shí)間。隨著云計(jì)算時(shí)代的到來,我們需要光傳輸網(wǎng)絡(luò)具備更好的靈活性和可拓展性。
另外設(shè)備的硬件形態(tài)也希望統(tǒng)一。越來越多的網(wǎng)絡(luò)設(shè)備和型號(hào)對(duì)于運(yùn)營的挑戰(zhàn)是持續(xù)增長(zhǎng)的,所以我們需要在把網(wǎng)絡(luò)變得更加開放的同時(shí),讓所有的設(shè)備,無論是IP設(shè)備還是光傳輸設(shè)備,都具備硬件形態(tài)的統(tǒng)一。
IP+光的統(tǒng)一運(yùn)營,其實(shí)是IPOC方案最核心的出發(fā)點(diǎn)之一,也是解決海量運(yùn)維問題的必經(jīng)之路。只有讓運(yùn)維域更加扁平化,將IP和光融合,才能實(shí)現(xiàn)對(duì)光和IP進(jìn)行統(tǒng)一運(yùn)營,甚至未來的統(tǒng)一調(diào)度。
IPOC互聯(lián)場(chǎng)景需求
長(zhǎng)久以來網(wǎng)絡(luò)為業(yè)務(wù)提供的服務(wù)能力,是城域之內(nèi)120公里以內(nèi)2到3毫秒,我們更多的聚焦在當(dāng)網(wǎng)絡(luò)發(fā)生故障時(shí),如何加快網(wǎng)絡(luò)的收斂速度。但隨著云計(jì)算時(shí)代的到來,伴隨著騰訊云在國內(nèi)和海外的快速擴(kuò)張,網(wǎng)絡(luò)中越來越多的承載了ToB業(yè)務(wù),這些業(yè)務(wù)通常是中小型或初創(chuàng)企業(yè),其在業(yè)務(wù)上通常不會(huì)像大型OTT企業(yè)的主流業(yè)務(wù)一樣具備完整的冗余或負(fù)載能力,所以要求基礎(chǔ)網(wǎng)絡(luò)提供更加極致的低時(shí)延環(huán)境。
因此,IPOC方案首先需要低時(shí)延,通過減少光傳輸系統(tǒng)中的電處理等方式,追求亞毫秒級(jí)的時(shí)延節(jié)省。
其次是低功耗。交換機(jī)直出彩光方案意味著交換機(jī)可以通過光模塊或者板卡直接發(fā)出不同波長(zhǎng)的彩光,隨之帶來的是光模塊和板卡需要更高的功耗和更強(qiáng)的散熱需求,這些都會(huì)影響交換機(jī)的端口密度。所以IPOC方案需要做到低功耗,甚至是接近灰光模塊的功耗,從而保證網(wǎng)絡(luò)設(shè)備的整機(jī)吞吐量。
IPOC光傳輸方案要覆蓋到城市內(nèi)跨園區(qū)的、點(diǎn)到點(diǎn)的、光纖距離小于120公里的互聯(lián)場(chǎng)景。另外通過方案的簡(jiǎn)化,可以降低城域帶寬建設(shè)成本。
光傳輸?shù)谋举|(zhì)是光信號(hào)在物理介質(zhì)上的傳輸,所以在方案設(shè)計(jì)和選擇時(shí)光纖距離是重要因素。圖2是騰訊目前城域互聯(lián)光纖距離的一個(gè)統(tǒng)計(jì)。
現(xiàn)在已有超過40%的光纖距離是在60公里之內(nèi),國內(nèi)除了北上廣深四個(gè)超大型城市外,其他大部分城市城域光纖互聯(lián)的距離都可以在60公里之內(nèi)。
騰訊作為公有云服務(wù)提供商,以為用戶提供極致網(wǎng)絡(luò)為目標(biāo),這意味著騰訊的網(wǎng)絡(luò)要盡量的貼近用戶,公有云用戶大量的集中在北上廣深,所以騰訊需要將IDC集群在這四個(gè)城市落地。而這些城市資源相對(duì)緊張,很難部署超大規(guī)模的IDC園區(qū),取而代之的是更多的中小型的園區(qū),所以60km以內(nèi)的光纖占比未來會(huì)變得更高,這也是100G QSFP28非相干彩光方案的一個(gè)重要場(chǎng)景。
超過60公里的光纖范圍內(nèi)仍然采用傳統(tǒng)的相干方案,一種是100G/200G CFP2 DCO的交換機(jī)直出彩光方案,另一種是基于傳統(tǒng)OTN的簡(jiǎn)化,我們稱之為Pizzabox OTN。
圖3是基于100G QSFP28 非相干技術(shù)實(shí)現(xiàn)的交換機(jī)直出彩光方案示意說明。
兩個(gè)交換機(jī)通過QSFP28彩光模塊直接出彩光,中間OLS系統(tǒng)進(jìn)行光放和合分波。我們聚焦于運(yùn)營系統(tǒng)的設(shè)計(jì),將整個(gè)系統(tǒng)定義成一個(gè)以太網(wǎng)的設(shè)備運(yùn)維域,并從三個(gè)維度進(jìn)行故障監(jiān)控和分析。
在交換機(jī)上通過對(duì)彩光模塊提供的豐富接口進(jìn)行監(jiān)控,監(jiān)控每一個(gè)光模塊或者每一個(gè)波長(zhǎng)的性能參數(shù);當(dāng)發(fā)生故障時(shí)聯(lián)動(dòng)OLS系統(tǒng)的告警信息,初步完成問題定界,并根據(jù)OLS自身的報(bào)警信息和故障影響范圍可基本完成故障點(diǎn)的判斷;極端故障場(chǎng)景下,可以在OLS外掛OSA進(jìn)行逐波檢測(cè)以確認(rèn)故障原因。
Tencent Defined IPOC解決方案
IPOC的目標(biāo)是讓網(wǎng)絡(luò)變得更加開放,這意味著未來會(huì)有更多的供應(yīng)商能夠以白盒或灰盒的方式,幫助騰訊構(gòu)建網(wǎng)絡(luò),同時(shí)這也對(duì)網(wǎng)絡(luò)運(yùn)營提出了更高的挑戰(zhàn)。
一方面,IPOC包含了光設(shè)備和IP設(shè)備,所以我們需要所有的IP設(shè)備或者光傳輸設(shè)備在硬件層面上盡可能保持統(tǒng)一。
另一方面,無論是IP設(shè)備還是光傳輸設(shè)備,都需要具備軟硬件解耦能力。這樣讓用戶可以通過在商用OS之上的應(yīng)用開發(fā),完成定制化的需求開發(fā)和快速迭代。