什么是數(shù)據(jù)處理單元為什么要關(guān)心
隨著Nvidia Corp.的GPU技術(shù)大會在星期一開始,最有趣的產(chǎn)品公告之一是引入了數(shù)據(jù)處理單元,也稱為DPU。
英偉達(dá)被公認(rèn)為圖形處理單元的市場領(lǐng)導(dǎo)者,并且最近宣布了計劃收購Arm Ltd.的計劃,以轉(zhuǎn)移到中央處理單元或CPU中?,F(xiàn)在,它正在推銷稱為DOCA或片上數(shù)據(jù)中心的產(chǎn)品,該體系結(jié)構(gòu)可提高數(shù)據(jù)中心網(wǎng)絡(luò),安全性和存儲的性能。
關(guān)于DPU的一種簡單思考方法是,它已經(jīng)增強(qiáng)了網(wǎng)絡(luò)接口卡或NIC的性能,可以執(zhí)行服務(wù)器上CPU所執(zhí)行的許多任務(wù)-SmartNIC,如VMware Inc.在與Nvidia的公告中所說的那樣。上個星期。 通過卸載這些功能,服務(wù)器可以處理更多的裸機(jī),虛擬或容器化工作負(fù)載。 在傳統(tǒng)體系結(jié)構(gòu)中,NIC處理基本的網(wǎng)絡(luò)功能,而服務(wù)器上的CPU執(zhí)行諸如基礎(chǔ)結(jié)構(gòu)管理以及軟件定義的存儲,安全性和網(wǎng)絡(luò)等任務(wù)。
借助DPU,Nvidia已采用了Mellanox NIC,并在其中加載了芯片和軟件以提高服務(wù)器性能。在GTC上,Nvidia宣布了兩種DPU:
BlueField-2 DPU是具有ARM內(nèi)核的Mellanox ConnectX-6 DX SmartNIC。 “卡”(實際上是板上的服務(wù)器)是完全可編程的,具有每秒200 GB的數(shù)據(jù)傳輸速率,并加速了網(wǎng)絡(luò),安全和存儲功能,例如分段,根信任,密鑰管理,RDMA / RoCE,塊存儲和壓縮。
BlueField-2X是Bluefield-2,但上面裝有Nvidia的用于人工智能目的的Ampere GPU。
英偉達(dá)企業(yè)計算部門負(fù)責(zé)人Manuvir Das在與分析師的會前電話會議中做出了一個大膽的預(yù)測,即“每臺運入數(shù)據(jù)中心的服務(wù)器”都將裝有DPU。 盡管 我認(rèn)為這種說法有點激進(jìn),但我確實認(rèn)為DPU會獲得很大的吸引力。
基本的BlueField非常適合具有高密度虛擬機(jī)或容器的服務(wù)器。 BlueField-2X是更有趣的產(chǎn)品,因為它可以大大提高執(zhí)行AI任務(wù)的服務(wù)器。 實時的安全分析是其中一項低落的水果用例,其中的AI用于識別可能表明違規(guī)的異常流量。 使用AI和DPU,可以以線速完成該任務(wù),從而限制了安全事件的影響。
具有額外處理功能的NIC并不是真正的概念,但是Nvidia的時機(jī)很好。 對于那些已經(jīng)從事該行業(yè)一段時間的人來說,可能還記得帶有嵌入式防火墻的3Com NIC或Chelsio和Intel TOE(TCP卸載引擎),它們改善了卡上的網(wǎng)絡(luò)處理能力。 這些是DPU的早期版本,慘遭失敗。 這次有什么不同?
過去,我曾經(jīng)認(rèn)為TOE和類似的其他產(chǎn)品是個好主意,但在某種程度上卻是解決問題的解決方案。 十年前,平均服務(wù)器利用率不到40%,因此,當(dāng)服務(wù)器甚至沒有接近極限時,沒有太多理由從服務(wù)器上卸載處理。
如今,情況并非如此,因為虛擬化和容器已將服務(wù)器推向極限。實際上,與我交談過的許多企業(yè)都在升級之前將服務(wù)器利用率推高到90%。 更換服務(wù)器可能會造成很大的破壞,并可能導(dǎo)致不必要的停機(jī),因此公司會盡可能地將其淘汰。放下這些DPU之一可以將服務(wù)器的壽命延長數(shù)月甚至數(shù)年。
由AI驅(qū)動的另一個因素推動了對更快計算的需求。 Nvidia首席執(zhí)行官Jensen Huang在GTC主題演講中指出,“人工智能的并行度大大提高,而計算密集度則提高了數(shù)千到數(shù)百萬倍。開發(fā)軟件的方法不同。計算基礎(chǔ)架構(gòu)是不同的。工具不同。軟件運行方式不同,甚至部署方法也不同。人工智能需要徹底改造計算堆棧。” DPU通過將資源移出服務(wù)器來使計算堆棧發(fā)生變化,從而使服務(wù)器可以執(zhí)行其設(shè)計要執(zhí)行的更多工作。
使我相信DPU可以保留的因素是生態(tài)系統(tǒng)支持。上周在VMWorld上,VMware宣布將在其Cloud Foundation中使用DPU。除VMware外,Red Hat,Canonical和Check Point Software還宣布了對DPU的支持。另外,包括戴爾,華碩,聯(lián)想和超微在內(nèi)的許多服務(wù)器制造商將把Nvidia DPU集成到他們的系統(tǒng)中。
進(jìn)入數(shù)據(jù)中心的任何技術(shù)都必須具有強(qiáng)大的生態(tài)系統(tǒng),因為它需要與許多其他組件一起工作。 最初的類似顯卡浪潮實際上沒有第三方支持,但Nvidia BlueField似乎有很多支持。
大小公司的信息技術(shù)專業(yè)人士都擔(dān)心要從已經(jīng)花費的美元中擠出更多資金。 今天的服務(wù)器所執(zhí)行的工作負(fù)載比幾年前要處理得多。 DPU可以為那些相同的服務(wù)器提供急需的性能提升,從而使企業(yè)進(jìn)入AI時代。