金年會(huì)新聞

金年會(huì)

當(dāng)前位置: 首頁(yè) > 金年會(huì)新聞

金年會(huì)新聞

首頁(yè) > 金年會(huì)新聞

金年會(huì):AI芯片“推理”大戰(zhàn)打響,英偉達(dá)比例高達(dá)40%!

作者:金年會(huì)發(fā)布時(shí)間:2025-02-23

  來(lái)源:硬AIAI芯片的主戰(zhàn)場(chǎng)正在轉(zhuǎn)向一個(gè)規(guī)模更大、競(jìng)爭(zhēng)更激烈的領(lǐng)域——推理。英偉達(dá)首席財(cái)務(wù)官Colette Kress在上周表示,英偉達(dá)最大的營(yíng)收來(lái)源數(shù)據(jù)中心部門(mén)中,去年有超過(guò)40%的業(yè)務(wù)是有關(guān)部署AI模型,而非訓(xùn)練——這一比例是AI芯片市場(chǎng)開(kāi)始轉(zhuǎn)向的重要跡象。訓(xùn)練AI模型的芯片需求一舉推升英偉達(dá)成為“芯片新王”,隨著該行業(yè)的迅速發(fā)展,下一個(gè)市場(chǎng)焦點(diǎn)將是實(shí)際運(yùn)行時(shí)用于推理的芯片。相較于訓(xùn)練芯片而言,推理芯片對(duì)功耗和成本的要求沒(méi)那么高,這同時(shí)也意味著競(jìng)爭(zhēng)市場(chǎng)會(huì)變得更為激烈,英偉達(dá)的“新王”地位還能否延續(xù)?

AI芯片“推理”大戰(zhàn)打響,英偉達(dá)比例高達(dá)40%!

  從GPU到LPU在訓(xùn)練階段,公司往往會(huì)給模型“喂”海量數(shù)據(jù)進(jìn)行大規(guī)模神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。由于高計(jì)算密度、低能耗、內(nèi)存帶寬大等要求,目前大多數(shù)AI模型的訓(xùn)練均依賴于英偉達(dá)的GPU。在推理階段,AI模型在訓(xùn)練的基礎(chǔ)上,利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行推理預(yù)測(cè),從而響應(yīng)用戶指令。這類(lèi)芯片(LPU)對(duì)整體性能的要求沒(méi)有GPU那么高,但推理引擎性能更強(qiáng)。對(duì)于AI芯片制造商們來(lái)說(shuō),推理芯片正在變得越來(lái)越重要,并在市場(chǎng)中占據(jù)越來(lái)越多的機(jī)遇。據(jù)報(bào)道,Melius Research的分析師Ben Reitzes在給客戶的一份說(shuō)明中表示:

  “有看法認(rèn)為,英偉達(dá)未來(lái)在推理領(lǐng)域的市場(chǎng)份額將低于訓(xùn)練領(lǐng)域。”

  “這意味著即將到來(lái)的‘推理爆炸’可能會(huì)帶來(lái)一波收益金年會(huì)金字招牌信譽(yù)至上。”美銀分析師Vivek Arya同樣認(rèn)為,伴隨AI模型訓(xùn)練投資激增,重點(diǎn)將轉(zhuǎn)向從AI模型中創(chuàng)收,推理領(lǐng)域相較于英偉達(dá)主導(dǎo)的訓(xùn)練領(lǐng)域更具競(jìng)爭(zhēng)力。從英偉達(dá)給出的“40%”比例來(lái)看,現(xiàn)在推理技術(shù)的發(fā)展速度可能要比此前預(yù)期的快得多。今年年初,瑞銀分析師曾預(yù)計(jì),到明年,有90%的芯片需求將源于訓(xùn)練,推理芯片僅占到市場(chǎng)的20%。英偉達(dá)的競(jìng)爭(zhēng)對(duì)手們正在蠢蠢欲動(dòng)。有觀點(diǎn)認(rèn)為,隨著客戶越來(lái)越講求降低AI模型的運(yùn)營(yíng)成本,英特爾的芯片將越來(lái)越具吸引力。有消息稱(chēng),英特爾擅長(zhǎng)制造的芯片類(lèi)型已經(jīng)廣泛用于推理領(lǐng)域,和英偉達(dá)更尖端、更昂貴的H100在實(shí)際推理應(yīng)用中差別不大。英特爾的CEO Pat Gelsinger在去年年底的一次采訪中曾提到:

  “從經(jīng)濟(jì)學(xué)的角度看推理應(yīng)用的話,我不會(huì)打造一個(gè)需要花費(fèi)4萬(wàn)美元的全是H100的后臺(tái)環(huán)境,因?yàn)樗碾娞啵⑶倚枰獦?gòu)建新的管理和安全模型,以及新的IT基礎(chǔ)設(shè)施。”

  “如果我能在標(biāo)準(zhǔn)版的英特爾芯片上運(yùn)行這些模型,就不會(huì)出現(xiàn)這些問(wèn)題。”除了英特爾和AMD等老牌芯片巨頭,一些初創(chuàng)公司也可能“乘風(fēng)而起”。谷歌前人工智能芯片工程師Jonathan Ross創(chuàng)立的公司Groq是挑戰(zhàn)者之一,該公司開(kāi)發(fā)的LPU宣稱(chēng)是“史上最快大模型”,以每秒500個(gè)token,徹底顛覆了GPT-4的40 tok/s的速度紀(jì)錄。

  黃仁勛:推理業(yè)務(wù)占40%,AI已成功成本仍然是一道坎。包括亞馬遜、谷歌、微軟在內(nèi)的巨頭們一直致力于內(nèi)部開(kāi)發(fā)推理芯片,希望縮減運(yùn)營(yíng)成本。Ross指出:

  “對(duì)于推理領(lǐng)域,你能部署多少取決于成本。”

  “在谷歌,有很多模型都能訓(xùn)練成功,但其中的80%都沒(méi)能部署,因?yàn)橥懂a(chǎn)的成本太高了。”芯片軟件初創(chuàng)公司SambaNova的CEO Rodrigo Liang表示:

  “我們看到我們的推理應(yīng)用案例正在迅速增長(zhǎng)。”

  “人們開(kāi)始意識(shí)到,80%以上的成本將用于推理,我需要尋找替代解決方案。”目前看來(lái),英偉達(dá)仍在此次轉(zhuǎn)向中處于領(lǐng)先地位。據(jù)悉,英偉達(dá)一款即將推出的芯片在去年一項(xiàng)關(guān)鍵的人工智能推理基準(zhǔn)測(cè)試中取得了行業(yè)領(lǐng)先的結(jié)果,延續(xù)了該公司多年來(lái)在競(jìng)爭(zhēng)中的主導(dǎo)地位。并且,英偉達(dá)最新的財(cái)報(bào)顯示,該公司在AI芯片領(lǐng)域仍占有80%以上的市場(chǎng)份額。這意味著,在可預(yù)見(jiàn)的未來(lái),英偉達(dá)的訓(xùn)練芯片預(yù)計(jì)仍將保持較高需求。美東時(shí)間2月23日,英偉達(dá)CEO黃仁勛在接受《連線(Wired)》采訪時(shí)表示,英偉達(dá)目前業(yè)務(wù)中推理占到40%,這意味著AI模型將會(huì)很快落地。他表示:

  “我們熱愛(ài)推理。讓我估算的話,我認(rèn)為英偉達(dá)今天的業(yè)務(wù)構(gòu)成可能是40%的推理和60%的訓(xùn)練。為什么這是一件好事呢?因?yàn)檫@意味著人工智能終于取得了成功(AI is finally making it)。”

  “今天,每當(dāng)你在云中輸入一個(gè)提示,它會(huì)生成一些東西——可能是視頻,可能是圖像,可能是2D,可能是3D,可能是文本,可能是圖表——這背后很可能就有一塊英偉達(dá)GPU。”?星標(biāo)華爾街見(jiàn)聞,好內(nèi)容不錯(cuò)過(guò)?本文不構(gòu)成個(gè)人投資建議,不代表平臺(tái)觀點(diǎn),市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎,請(qǐng)獨(dú)立判斷和決策。

  覺(jué)得好看,請(qǐng)點(diǎn)“在看”

13244777854

jinnianhui@899.com

主站蜘蛛池模板: 国产特级毛片AAAAAA视频 | 明星造梦一区二区| 最近中文字幕大全高清视频| 国产精品视频久久| 亚洲成人黄色网| 中文精品无码中文字幕无码专区| 99久久人妻无码精品系列蜜桃| 男生和女生污污的视频| 尹人久久大香找蕉综合影院| 午夜视频www| 一个人的突击队3电影在线观看 | 黄页网址大全免费观看12网站 | 裴远之的原型人物是谁| 欧美视频在线观| 国内最真实的XXXX人伦| 动漫美女被爆羞羞免费| 一级毛片在播放免费| 男女无遮挡毛片视频播放| 日本动漫h在线| 国产精品久免费的黄网站| 免费又黄又爽的视频| a级精品国产片在线观看| 波多野结衣www| 女人与公狗交酡过程高清视频| 免费无码专区毛片高潮喷水| 99热在线精品免费播放6| 精品偷自拍另类在线观看| 日韩不卡高清视频| 国产ts亚洲人妖| 一本大道AV伊人久久综合| 老头天天吃我奶躁我的视频| 成人在线视频一区| 免费久久精品国产片香蕉| 91不卡在线精品国产| 欧美69vivohd| 国产中文字幕第一页| 久久精品无码专区免费青青| 色吊丝中文字幕| 小h片在线播放| 嗯啊公交车上被群j| caoporm碰最新免费公开视频|