金年會官方網站入口:AMD蘇姿豐:AI日趨成熟,芯片行業不能只盯著GPU
作者:金年會發布時間:2025-02-03
未來的計算機芯片或許能幫助降低生成式人工智能(AI)驚人的能源需求,但芯片制造商表示,他們首先需要AI做出一些改變:放慢飛速發展的步伐。
到目前為止,圖形處理單元(GPU)在訓練和運行大AI模型方面一直占據主導地位。這些芯片最初是用來處理游戲圖形的,其獨特之處在于可將較高的性能與靈活性和可編程性集于一身,從而能夠緊跟當今AI模型日新月異的腳步。
英偉達(Nvidia)在GPU市場占據主導地位,其估值已達到1萬億美元,但包括Advanced Micro Devices(AMD)在內的其他公司也在生產這種芯片,但AMD首席執行官蘇姿豐(Lisa Su)表示,隨著行業將精力集中于更加標準化的模型設計,將有機會構建更多在可編程性和靈活性方面要求不那么高的定制芯片。這種芯片將更加節能、體積更小、成本更低。
“目前,GPU是大語言模型的首選架構,因為GPU在并行處理方面非常高效,但在可編程性方面有所欠缺,”蘇姿豐說。“五年多后它還會是首選架構嗎?我認為情況會發生變化。”
蘇姿豐預計,五年或七年時間內GPU還不會失勢,但會出現GPU以外的新勢力。
英偉達和AMD尚未透露具體計劃。
一些定制芯片已經被用于處理AI的多方面工作。亞馬遜(Amazon)和谷歌等大型云計算提供商已經開發了自己的定制AI芯片供內部使用,例如亞馬遜的AWS Trainium和AWS Inferentia,以及谷歌的張量處理單元(TPU)。這些芯片只用于執行特定功能:例如,Trainium只能訓練模型,而Inferentia只能進行推理。推理比訓練的強度低,在訓練過程中,模型要處理新信息并做出響應。
博通(Broadcom)首席執行官陳福陽(Hock Tan)今年在一次內部講話中表示,該公司定制芯片部門的季度營業利潤超過10億美元。該部門主要幫助谷歌制造AI芯片。

市場情報公司國際數據公司(International Data Corp., 簡稱IDC)計算半導體研究副總裁Shane Rau表示,定制芯片在節能和成本方面具有很大優勢,體積也小得多,因為它們可以在一定程度上進行硬連接:它們可以執行一項特定功能,運行一種特定類型的模型,甚至可以運行某一個特定模型。
但Rau表示,商業化銷售這些超級定制化專用芯片的市場仍不成熟,這是AI模型創新令人應接不暇的一個表現。
研究公司Gartner的副總裁分析師Chirag Dekate表示,高度定制的芯片還存在靈活性和互操作性不足的問題。這種芯片非常難以編程,通常需要定制軟件堆棧,而且很難讓它們與其他類型的芯片協同工作。金年會金字招牌信譽至上
但如今許多芯片產品都呈現出某種中間狀態,一些GPU可以進行更多定制,一些專用芯片有一定程度的可編程性。這為芯片制造商帶來機會,甚至是在生成式AI更加標準化之前。這也可能是個難題。
“這是我們一直在努力解決的一個大問題,”Etched聯合創始人兼首席執行官Gavin Uberti說。這家初創公司生產的芯片只在Transformer架構上進行推理,該架構由谷歌在2017年開發,此后成為大語言模型的標準。盡管在一定程度上可以定制,但芯片還必須擁有足夠靈活性,以適應依模型而不同的較小作業。
此前,微軟也在Ignite技術大會上發布了首款自家研發的AI芯片Azure Maia 100,以及應用于云端軟件服務的芯片Azure Cobalt。兩款芯片將由臺積電代工,采用5nm制程技術。Arm 近日宣布推出 Ethos-U85 NPU。OpenAI也正在探索自研AI芯片,同時開始評估潛在收購目標。AWS自研AI芯片陣容包括推理芯片Inferentia和訓練芯片Trainium。
“目前,這些模型已經足夠穩定,我認為押注Transformer說得通,但我認為押注Llama 3.1 405B目前還不行,”Uberti說,他指的是Meta Platforms的AI模型。“Transformer還會在,但它們會變得更大、不斷進化。”他補充說,“你必須小心,不要太定制化。”
AMD首席執行官蘇姿豐表示,計算方面也沒有萬能的解決方案。未來的AI模型將使用不同類型芯片的組合,包括當今占主導地位的GPU以及仍有待開發的更專門化的芯片,以實現各種功能。
“還會有其他架構,”她說。“只是這將取決于模型的發展。”