▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

Gartner:算力、能耗、邊緣三大考驗(yàn),企業(yè)如何贏在AI時(shí)代?

2025-06-14 12:07
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

作者:王聰彬

從ChatGPT問(wèn)世以來(lái),生成式AI在幾年間一直在高光中快速成長(zhǎng)。但是在陰影中,也逐漸顯現(xiàn)出一些問(wèn)題,而這些問(wèn)題反而是讓企業(yè)可以贏得AI時(shí)代的先機(jī)。

“AI計(jì)算正在不斷演進(jìn)、AI算力問(wèn)題=新機(jī)會(huì)、迎接強(qiáng)大的邊緣AI”,這是Gartner看到的三大顛覆性變革。Gartner高級(jí)研究總監(jiān)曾劭清(Evan Zeng)認(rèn)為,開(kāi)發(fā)AI能力的產(chǎn)品領(lǐng)導(dǎo)者必須提前布局,不僅要應(yīng)對(duì)變革,更要把握這一新增長(zhǎng)窗口。

AI計(jì)算正在不斷演進(jìn),算力新紀(jì)元已來(lái)

訓(xùn)練和推理是AI的兩大主要工作負(fù)載,數(shù)據(jù)顯示,訓(xùn)練對(duì)于算力的需求在2024-2027年處于穩(wěn)定上漲,增幅不大,推理對(duì)于算力的需求卻在快速上升。

“推理應(yīng)用的需求正持續(xù)快速增長(zhǎng),未來(lái)大量的AI算力消耗將主要來(lái)自推理環(huán)節(jié)。”曾劭清看到,當(dāng)前在線應(yīng)用的服務(wù)質(zhì)量高度依賴網(wǎng)絡(luò)架構(gòu),比如一個(gè)推理應(yīng)用如果僅托管在北京,南方用戶的網(wǎng)絡(luò)延遲就會(huì)顯著增加,為此必須在多個(gè)區(qū)域分布式托管,并給予每個(gè)托管點(diǎn)相應(yīng)的推理算力支持,才能保證AI應(yīng)用的實(shí)時(shí)響應(yīng)和服務(wù)質(zhì)量。

Gartner預(yù)計(jì)到2028年,全球推理所消耗的算力將達(dá)到訓(xùn)練的3倍,在中國(guó)這一比例有望進(jìn)一步拉大,預(yù)計(jì)達(dá)到4:1,甚至更高。

由于市面上的基礎(chǔ)模型大多基于Transformer架構(gòu),所以到2030年,基于Transformer的應(yīng)用也將增加8倍,這對(duì)于半導(dǎo)體行業(yè)也會(huì)帶來(lái)一系列變化。

半導(dǎo)體行業(yè)可以分為GPU和非GPU的AI加速器兩類,兩種類型加速器的發(fā)展路線有所不同,前者是通用架構(gòu)設(shè)計(jì),適用于訓(xùn)練和推理,后者針對(duì)AI應(yīng)用架構(gòu)去設(shè)計(jì)AI半導(dǎo)體,多用于推理。所以預(yù)計(jì)到2027年,針對(duì)AI推理應(yīng)用的算力需求上,AI加速器將超越GPU出貨量。

Gartner預(yù)計(jì),到2030年,數(shù)據(jù)中心擴(kuò)散模型工作負(fù)載芯片的銷售機(jī)會(huì)將增長(zhǎng)25倍,達(dá)到70億美元。

隨著聲音、視頻、圖像等多模態(tài)生成需求的激增,基于Diffusion等生成算法的專用芯片將在未來(lái)快速增長(zhǎng)。曾劭清談到,通用GPU架構(gòu)會(huì)進(jìn)一步向算法適配型算力芯片轉(zhuǎn)移,中國(guó)廠商正積極切入這一賽道,預(yù)計(jì)未來(lái)中美將在這一領(lǐng)域展開(kāi)新一輪激烈競(jìng)爭(zhēng)。

AI算力問(wèn)題=機(jī)會(huì),AI新周期已至

Gartner在2025年初的調(diào)研顯示,60%的AI實(shí)踐場(chǎng)景最終不能應(yīng)用到實(shí)際生產(chǎn)場(chǎng)景,主要是因?yàn)闇?zhǔn)確度,AI場(chǎng)景的投資回報(bào)率、缺乏AI場(chǎng)景就緒的數(shù)據(jù)等多種因素。

不斷嘗試切換場(chǎng)景,帶來(lái)的直接后果就是成本攀升,這也成為企業(yè)在落地AI過(guò)程中面臨的一大挑戰(zhàn)。另一成本挑戰(zhàn)則來(lái)自電力,未來(lái)每投入1美元在AI服務(wù)器上,相應(yīng)的電力預(yù)算就需要增加0.35美元,可見(jiàn)AI服務(wù)器的耗電量之高。

曾劭清舉了個(gè)例子說(shuō)明,目前中國(guó)乃至全球的大型IDC(互聯(lián)網(wǎng)數(shù)據(jù)中心)基本是按5千瓦/機(jī)柜的標(biāo)準(zhǔn)設(shè)計(jì),機(jī)柜內(nèi)通常部署的是1U或2U的低功耗通用服務(wù)器。但隨著AI算力需求的提升,傳統(tǒng)配置難以支撐未來(lái)AI服務(wù)器高密度、高功耗應(yīng)用場(chǎng)景。

預(yù)計(jì)到2027年全球AI數(shù)據(jù)中心帶來(lái)的新增電力消耗將達(dá)到500兆瓦,相當(dāng)于德國(guó)全國(guó)的整體耗電量,所以電力的供給會(huì)限制創(chuàng)新。

“軟件、新架構(gòu)、冷卻技術(shù)和網(wǎng)絡(luò)多層面的創(chuàng)新,才能減少生成式AI帶來(lái)的電力消耗。”曾劭清說(shuō)。

AI帶來(lái)的變化是一系列相互關(guān)聯(lián)的連鎖反應(yīng),算力的持續(xù)提升必然伴隨著電力密度的上升,電力密度的增加又直接導(dǎo)致整體用電量的增長(zhǎng),而隨之而來(lái)的是發(fā)熱量的上升,這又進(jìn)一步推高了對(duì)制冷系統(tǒng)的需求。

依托基礎(chǔ)設(shè)施監(jiān)測(cè)與分析來(lái)實(shí)現(xiàn)動(dòng)態(tài)調(diào)節(jié)就變得尤為重要,通過(guò)實(shí)時(shí)監(jiān)測(cè)判斷機(jī)柜是否正在進(jìn)行高強(qiáng)度計(jì)算,如果發(fā)現(xiàn)用電量快速上升,及時(shí)調(diào)動(dòng)制冷系統(tǒng)。處于閑置或低負(fù)載狀態(tài)的機(jī)柜,則可以適當(dāng)降低制冷輸出,從而整體優(yōu)化能耗結(jié)構(gòu),提升能源使用效率。

迎接強(qiáng)大的邊緣AI,行動(dòng)計(jì)劃已啟

隨著模型的不斷演進(jìn),越來(lái)越多企業(yè)意識(shí)到,參數(shù)規(guī)模并非越大,結(jié)果就越精準(zhǔn)。

現(xiàn)在部分AI應(yīng)用的領(lǐng)軍企業(yè)已經(jīng)開(kāi)始根據(jù)不同場(chǎng)景,靈活選用不同參數(shù)規(guī)模的模型,以實(shí)現(xiàn)最優(yōu)的ROI。而且小模型可以進(jìn)一步部署在邊緣,像“文生圖”“文生視頻”這類應(yīng)用,通常更適合在邊緣節(jié)點(diǎn)就近完成推理計(jì)算。

“在邊緣部署,不僅能降低數(shù)據(jù)傳輸帶來(lái)的帶寬費(fèi)用,還能提升服務(wù)實(shí)時(shí)性和用戶體驗(yàn),這也是生成式AI未來(lái)應(yīng)用落地的重要趨勢(shì)之一。”曾劭清說(shuō)道。

本地生成式AI處理給用戶帶來(lái)四大好處:

第一,個(gè)性化:將AI部署在企業(yè)數(shù)據(jù)中心、個(gè)人電腦或手機(jī)等本地環(huán)境,可以直接訪問(wèn)本地?cái)?shù)據(jù),滿足個(gè)性化和上下文需求,更貼近用戶個(gè)性化需求。

第二,隱私與安全:企業(yè)數(shù)據(jù)通常需要分類分級(jí)管理,敏感信息不能上傳到外部大模型,要將AI智能體部署在本地,避免數(shù)據(jù)泄露風(fēng)險(xiǎn),保障信息安全。

第三,延時(shí):像“文生圖”“文生視頻”應(yīng)用對(duì)實(shí)時(shí)性要求高,部署在邊緣可以大幅降低網(wǎng)絡(luò)時(shí)延,尤其適合醫(yī)療、工業(yè)等對(duì)響應(yīng)速度敏感的場(chǎng)景。

第四,成本與電力:本地小模型功耗低、成本可控,而超大模型集中部署不僅成本高,耗電也大。合理選擇模型規(guī)模和部署方式,有助于優(yōu)化整體算力成本。

總而言之,針對(duì)三大趨勢(shì),AI產(chǎn)品領(lǐng)導(dǎo)者要制定自己的行動(dòng)計(jì)劃。硬件提供商:重新定位計(jì)算平臺(tái)滿足AI在云端邊的算力需求;軟件提供商:選擇合適的硬件平臺(tái)滿足軟件內(nèi)嵌AI的需求;云服務(wù)提供商:部署訓(xùn)練和推理的算力平臺(tái)滿足云和邊緣AI應(yīng)用;數(shù)據(jù)中心提供商:規(guī)劃高密度機(jī)柜,液冷設(shè)施和提升機(jī)房電力容量。

企業(yè)做AI同樣需要制定清晰的戰(zhàn)略規(guī)劃,就像當(dāng)年“上云”一樣,如何協(xié)調(diào)各方角色將成為成敗的關(guān)鍵。

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            主站蜘蛛池模板: 达州市| 棋牌| 桐庐县| 昭苏县| 平遥县| 许昌市| 长治市| 鄂尔多斯市| 淮阳县| 武功县| 深水埗区| 长岭县| 溧水县| 安庆市| 恩平市| 德庆县| 永德县| 吉安县| 唐海县| 天柱县| 上高县| 桂阳县| 故城县| 东乡县| 麻栗坡县| 福鼎市| 黄陵县| 枣强县| 黄骅市| 平南县| 新丰县| 浦北县| 金平| 北安市| 霍城县| 淮安市| 永登县| 鲁山县| 佛学| 广德县| 平利县|