谷歌新的CloudTPUPods提供按需AI超級計算機
Google LLC今天通過推出Cloud TPU Pods擴展了其云平臺,Cloud TPU Pods是針對需要大量計算能力的大型人工智能項目的新基礎架構選項。
Cloud TPU Pod本質上是一組在搜索巨頭的數(shù)據(jù)中心中運行的服務器機架。每個機架都裝有Google的Tensor處理器單元(如圖所示),這些芯片是為AI應用程序完全構建的定制芯片。該公司使用它們來支持廣泛的內(nèi)部服務,包括其搜索引擎和Google Translate。
到目前為止,在Google Cloud上,TPU只能單獨租用。與公司通常用于AI項目的圖形卡相比,它們具有許多優(yōu)勢,包括可能更高的速度。去年12月發(fā)布的基準測試表明,在執(zhí)行某些類型的任務時,TPU的性能比Nvidia Corp.的硬件好19%。
單個Cloud TPU Pod包含256或1,024芯片,具體取決于配置。256芯片版本使用Google在2017年首次推出的第二代TPU,峰值速度為11.5 petaflops。1,024芯片的配置又使用了Google的第三代TPU,從而在高端提供了107.5 petaflops的性能。
這些數(shù)字使產(chǎn)品進入了超級計算機領域。單個petaflop等于每秒四千萬次運算操作,而全球最強大的超級計算機Summit的峰值速度為200 petaflop。
誠然,在處理不如Summit正常處理的復雜數(shù)據(jù)時,Cloud TPU Pod只能達到最高速度,但是它們?nèi)匀粡姶?。Google通過應用程序編程接口提供了硬件,這些接口使AI團隊可以像對待單個TPU一樣使用TPU?;蛘?,開發(fā)人員可以在多個應用程序之間分配Pod的計算能力。
Google Cloud TPU的高級產(chǎn)品經(jīng)理Zak Stone在博客中寫道:“也可以使用稱為“切片”的Cloud TPU Pod的較小部分。“我們經(jīng)常看到ML團隊在單個Cloud TPU設備(通??捎?上開發(fā)其初始模型,然后通過數(shù)據(jù)并行性和模型并行性擴展到逐漸擴大的Cloud TPU Pod切片。”
Cloud TPU Pod目前處于測試階段。早期的客戶包括eBay公司和總部位于猶他州的生物技術公司Recursion Pharmaceutical Inc.,后者使用該產(chǎn)品對具有潛在醫(yī)療價值的分子進行測試。