金年會:谷歌推出第五代AI芯片:訓練和運行AI模型的速度提高5倍
作者:金年會發布時間:2025-01-17
·谷歌第五代定制張量處理器(TPU)芯片TPU v5e用于大模型訓練和推理,訓練和運行AI模型的速度提高了5倍。與上一代芯片相比,TPU v5e每一美元的訓練性能提高2倍,每一美元的推理性能提高2.5倍。
當地時間8月29日,谷歌在舊金山的年度云會議Google Cloud Next上發布了新的人工智能芯片,即第五代定制張量處理器(TPU)芯片TPU v5e,用于大模型訓練和推理。與上一代芯片相比,TPU v5e每一美元的訓練性能提高2倍,每一美元的推理性能提高2.5倍金年會金字招牌信譽至上。

TPU是谷歌為神經網絡設計的專用芯片,TPU經過優化可加快機器學習模型的訓練和推斷速度,2016年推出第一代TPU,2021年發布第四代定制處理器TPU,2022年面向開發者提供。云TPU(Cloud TPU)是一項谷歌云服務,適合訓練需要進行大量矩陣計算的大型復雜深度學習模型,例如大語言模型、蛋白質折疊建模和藥物研發等,幫助企業在實現AI工作負載時節省資金和時間。
此次推出的TPU v5e專為中大型模型訓練和推理所需的成本效益和性能而構建。谷歌云表示,該版本芯片的開發重點是效率,與上一代TPU v4相比,TPU v5e每一美元的訓練性能提高2倍,每一美元的推理性能提高2.5倍,而成本不到TPU v4的一半,使得更多組織能夠訓練和部署更大更復雜的AI模型。客戶不需要通過犧牲性能或靈活性來獲得這些成本效益。谷歌云將TPU v5e描述為“超級計算機”,最多允許256個芯片互連,總帶寬超過400 Tb/s,支持八種不同的虛擬機配置,客戶可選擇合適的配置服務于各種大語言模型和生成式AI模型。根據速度基準測試,在TPU v5e上訓練和運行AI模型時速度提高了5倍。
據科技媒體TechCrunch報道,谷歌云計算和機器學習基礎設施副總裁兼總經理馬克·洛邁爾(Mark Lohmeyer) 表示,“這是迄今為止最具成本效益且易于訪問的云TPU。” 洛邁爾強調,谷歌云確保用戶能夠將其TPU集群擴展到以前無法達到的水平,讓客戶能夠輕松擴展他們的人工智能模型,超越單個TPU集群的物理邊界。也就是說,單個大型人工智能工作負載可以跨越多個物理TPU集群,擴展到數萬個芯片,并且經濟高效。“在云GPU和云TPU方面,我們為客戶提供了很多選擇和靈活性,以滿足我們看到的人工智能工作負載的廣泛需求。”
除了新一代TPU,谷歌云還宣布將在下個月推出基于英偉達H100 GPU的A3系列虛擬機,作為GPU超級計算機進行交付,為人工智能大模型提供動力。