Iccsz訊 在昨天召開的“2017開放數(shù)據(jù)中心峰會”上,阿里巴巴基礎設施事業(yè)群總經(jīng)理周明表示,阿里巴巴基礎設施團隊,支持了來自整個淘寶、天貓為基礎的電商集團,以螞蟻金服、支付寶為核心的金融集團,以及以菜鳥網(wǎng)絡為核心的物流板塊,遇到了一些壓力和挑戰(zhàn)。
周明說,阿里巴巴擁有國際化的基礎設施和全球化的網(wǎng)絡,有巨大的服務器的保有量以及每年有相當數(shù)量新增的服務器量,如何去運營,如何提供技術(shù),都是一個非常大的壓力。他認為,降低成本是最原始的驅(qū)動力,但其實不夠,更重要的是如何構(gòu)建技術(shù)競爭力。
據(jù)周明介紹,阿里巴巴通過三個方面來應對這些挑戰(zhàn)。首先是白盒化,除了降低成本,還實現(xiàn)了很多優(yōu)秀技術(shù)的疊加;其次是架構(gòu)一體化,實現(xiàn)了從芯片到硬件,到基礎軟件平臺乃至上層應用的一體化設計;第三是智慧化,不僅僅提供一個設備、技術(shù)或者軟件,還提供7×24小時、365天的不中斷的服務,解決Online服務對基礎設施穩(wěn)定性的挑戰(zhàn)。
從數(shù)據(jù)中心的風火水電層面來看,最重要的是降低PUE,提高用電效率,因為能源成本已經(jīng)成為數(shù)據(jù)中心OPEX的大頭。阿里巴巴從最初的租用數(shù)據(jù)中心,到后來的自建,一直在不斷的摸索,比如杭州的數(shù)據(jù)中心將引入千島湖湖底冷水作為冷源,而在張北建立的數(shù)據(jù)中心則引入自然風冷,阿里巴巴做了非常多細致的工作。
從數(shù)據(jù)中心服務器層面來看,阿里巴巴從最開始購買整臺服務器,到后來的整機柜,甚至到服務器的部件、芯片,都逐步在做白盒化工作。從整機定制變成CPU定制,最初規(guī)格的定制,到微架構(gòu)的定制,包括采用越來越多的智能網(wǎng)卡,網(wǎng)絡已經(jīng)開始從交換機逐步落到服務器,最后落到網(wǎng)卡。當前,結(jié)合AI,比如FPGA、NPU等異構(gòu)技術(shù),也已經(jīng)進入考慮的范疇。
從數(shù)據(jù)中心網(wǎng)絡層面來看,阿里巴巴也在加快自研速度,從最下面的傳輸?shù)侥K自研,到上層交換機,甚至是OS層面的自研;在一些基礎軟件,比如涉及到VPC、虛擬網(wǎng)絡以及服務化QoS,包括整個流量的調(diào)度,把每一項技術(shù)深入到每一層來做白盒化的解決方案。
“事實證明白盒化是不夠的,白盒化只是解決了工作,我們的目的是架構(gòu)一體化,實現(xiàn)競爭能力。比如把PUE降低了夠不夠?不夠!還需要跟服務器、網(wǎng)絡,怎么有機的結(jié)合起來。從白盒化到架構(gòu)一體化,這是非常重要的核心,也是我們技術(shù)競爭力的體現(xiàn)。”周明說。
在談到智慧化時,周明指出,白盒化的設備和一體化的技術(shù)架構(gòu),要保證7×24小時的服務,依然會出現(xiàn)很多問題和故障,有了故障之后會對業(yè)務造成什么影響,如何快速的發(fā)現(xiàn)故障,定位故障,修復故障,這是非?,F(xiàn)實的演進過程。規(guī)模小的時候手工搞定就可以,規(guī)模大了一定是不行的,只有實現(xiàn)信息化和自動化,才能提高效率,走向未來的智慧化。