- +1
估算AI能耗極為棘手——但這份報(bào)告作出了一次嘗試
一個(gè)對(duì) AI 情有獨(dú)鐘的人每天可能消耗的電量足以讓微波爐連續(xù)運(yùn)行超過(guò)三小時(shí)。實(shí)際上這種損耗可能更甚,因?yàn)樵S多公司對(duì)其 AI 模型的詳細(xì)信息保密。
MIT Technology Review 與大約二十位跟蹤 AI 能耗的研究人員交談,同時(shí)開(kāi)展了自己的實(shí)驗(yàn),得出結(jié)論稱(chēng)總體能耗及其對(duì)氣候的影響極難準(zhǔn)確掌握,但這并未阻止他們進(jìn)行嘗試。
報(bào)告作者與 Hugging Face 的研究人員合作后確定,使用開(kāi)源 Llama 3.1 8B 引擎生成響應(yīng)時(shí),每次查詢(xún)大約消耗 57 焦耳的能量 ( 8B 表示該引擎使用 80 億參數(shù) )。考慮到制冷及其他能耗需求后,報(bào)告指出該數(shù)字應(yīng)翻倍,使得該模型每次查詢(xún)約需 114 焦耳 —— 相當(dāng)于微波爐運(yùn)行大約十分之一秒。而像 Llama 3.1 405B 這類(lèi)更大型的模型,每次響應(yīng)大約需要 6,706 焦耳 —— 相當(dāng)于微波爐運(yùn)行八秒。
換句話(huà)說(shuō),某個(gè)模型的規(guī)模在其能耗中起著至關(guān)重要的作用。盡管其真正規(guī)模仍是未知數(shù),但據(jù)估計(jì) OpenAI 的 GPT-4 參數(shù)數(shù)量遠(yuǎn)超一萬(wàn)億,這意味著其單次查詢(xún)的能耗很可能遠(yuǎn)高于測(cè)試中 Llama 模型的查詢(xún)能耗。
值得指出的是,上述數(shù)據(jù)均針對(duì)文本類(lèi)響應(yīng)。MIT Technology Review 提到,由于 AI 生成照片所用的模型規(guī)模較小,再加上擴(kuò)散相比推理更為節(jié)能,因此其能耗遠(yuǎn)低于文本響應(yīng)。
另一方面,AI 視頻生成則是一個(gè)巨大的能耗窟。
據(jù) Hugging Face 的研究人員透露,為生成一段時(shí)長(zhǎng)五秒、每秒 16 幀的視頻,CogVideoX AI 視頻生成模型所消耗的能量高達(dá) 3.4 百萬(wàn)焦耳 —— 這相當(dāng)于微波爐運(yùn)行一小時(shí)或騎電動(dòng)自行車(chē)行駛 38 英里。
報(bào)告指出,“可以肯定的是,領(lǐng)先的 AI 視頻生成器在創(chuàng)作長(zhǎng)達(dá) 30 秒的炫目且超現(xiàn)實(shí)的視頻時(shí),其能耗將顯著更高。”
基于這些數(shù)據(jù),報(bào)告作者編制了一個(gè)估算模型,分析了一個(gè)習(xí)慣性依賴(lài)生成式模型處理各種任務(wù)的人的日常 AI 能耗。每天提 15 個(gè)問(wèn)題、嘗試生成 10 張圖片以及制作 3 段適合 Instagram 發(fā)布的五秒視頻,總共大約消耗 2.9 千瓦時(shí)的電量 —— 相當(dāng)于微波爐連續(xù)運(yùn)行三個(gè)半小時(shí)。
OpenAI 估計(jì),全球每周有數(shù)億人在使用 ChatGPT。
研究人員主要關(guān)注我們較為了解的開(kāi)源大語(yǔ)言模型,但像 OpenAI 和 Google 這樣的大公司對(duì)其模型的規(guī)模和應(yīng)用范圍保密,這嚴(yán)重阻礙了對(duì) AI 能耗的準(zhǔn)確估算。
DIY AI 能耗估算
Hugging Face 的工程師 Julien Delavande 上個(gè)月發(fā)布了一款名為 ChatUI-Energy 的工具,該工具可以接入任何開(kāi)源 AI 模型以對(duì)其能耗進(jìn)行估算。
該工具能夠同時(shí)以瓦時(shí)和焦耳為單位估算能耗,并提供與現(xiàn)實(shí)中能耗等價(jià)物的比較,例如智能手機(jī)電池消耗量、微波爐運(yùn)行時(shí)間等。
ChatUI-Energy 的在線(xiàn)演示版采用了阿里巴巴的 Qwen2.5-VL-7B-instruct 模型,并提供了其他幾個(gè)可供試用的模型。其源代碼也已在 GitHub 上公開(kāi),方便與其他開(kāi)源模型配合使用。
雖然該工具并非完美無(wú)缺,和其他 AI 能耗建模工具一樣,它在計(jì)算過(guò)程中做出了許多假設(shè),而我們實(shí)驗(yàn)中這些假設(shè)并不總是一致。不過(guò),Hugging Face 的 AI 與氣候領(lǐng)域負(fù)責(zé)人 Sasha Luccioni 告訴我們,此項(xiàng)目旨在展示 AI 能耗透明度迫切需求的重要性。
“我們真正需要的是減少猜測(cè)、增加透明度,以及像這種工具,讓 AI 用戶(hù)獲取有關(guān)使用 AI 對(duì)地球帶來(lái)成本的信息,” Luccioni 在郵件中表示,“就像購(gòu)買(mǎi)產(chǎn)品時(shí)必須顯示成分信息一樣。”
當(dāng)涉及到衡量 CO2 排放時(shí),Tech Review 的文章指出,情況則更加復(fù)雜。由于可再生與非可再生能源的組合在不同地區(qū)和不同時(shí)段內(nèi)存在巨大差異 (例如夜間無(wú)法利用太陽(yáng)能),因此測(cè)算變得更加困難。
報(bào)告還沒(méi)有涉及 prompt caching 技術(shù) —— 一種生成式模型常用來(lái)存儲(chǔ)響應(yīng),在用戶(hù)提出相同或相似問(wèn)題時(shí)直接反饋,從而降低 AI 模型能耗的技術(shù)。
高能耗,絕非廉價(jià)
不論上述限制如何,有一點(diǎn)是毋庸置疑的:為了支持全球日益增長(zhǎng)的 AI 需求,消耗的能量非常巨大。而且,其中相當(dāng)一部分能源以碳排放的形式進(jìn)入大氣,其用途也存有爭(zhēng)議。
正如 Tech Review 報(bào)告所指出,目前數(shù)據(jù)中心能耗的激增是在多年來(lái)相對(duì)穩(wěn)定的消耗基礎(chǔ)上出現(xiàn)的,這得益于持續(xù)而穩(wěn)定的工作負(fù)載和不斷提升的能效。2023 年,數(shù)據(jù)中心消耗了愛(ài)爾蘭超過(guò)五分之一的電力。預(yù)計(jì)到 2030 年,全球數(shù)據(jù)中心的能耗將超過(guò)當(dāng)前水平的兩倍,并在下個(gè)十年伊始超過(guò)整個(gè)日本國(guó)家的能耗,而其中最大的推動(dòng)因素正是 AI。
多年以來(lái),科技公司一直在談?wù)摼G色環(huán)保,并長(zhǎng)期向公眾保證他們的數(shù)據(jù)中心不會(huì)對(duì)環(huán)境造成威脅,但隨著 AI 的加入,諸如 Microsoft 和 Google 等巨頭宣稱(chēng)的凈零目標(biāo)正逐漸遙不可及。
最近,《The Register》對(duì)此進(jìn)行了大量報(bào)道,而我們的報(bào)道與 MIT Technology Review 報(bào)告得出的結(jié)論基本一致:AI 背后的能耗遠(yuǎn)比科技公司愿意讓我們相信的要“臟”。
總體來(lái)看,預(yù)計(jì)到本十年末,數(shù)據(jù)中心將排放 25 億噸溫室氣體,這一數(shù)字是生成式 AI 成為最新熱點(diǎn)后排放量的三倍。
更令人擔(dān)憂(yōu)的是,這些數(shù)字所依賴(lài)的數(shù)據(jù)基礎(chǔ)極不穩(wěn)固,正如 Tech Review 報(bào)告所指出的。
“這使得即使是那些負(fù)責(zé)預(yù)測(cè)能耗需求的人也不得不拼湊一幅缺失無(wú)數(shù)碎片的拼圖,從而幾乎無(wú)法為 AI 對(duì)能源網(wǎng)和排放的未來(lái)影響作出準(zhǔn)確規(guī)劃,”報(bào)告中寫(xiě)道。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪(fǎng)問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線(xiàn): 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司