- +1
AI狂歡的背后:算力的能耗,我們該擔憂嗎?
原創 Sophia Chen 集智俱樂部

導語
ChatGPT等AI模型爆發式增長引發關鍵問題:這場AI革命需要消耗多少能源?本文探究數據中心在鄉村地區的快速擴張,以弗吉尼亞州為例,揭示研究者如何通過供應鏈分析和直接測量兩種方法估算AI能耗。雖然AI目前僅占全球能源消耗的小部分,但在數據中心集中區域影響顯著。技術效率的提升能否跑贏使用量的增長?這場能源與創新的博弈將如何影響我們的未來?
研究領域:生成式人工智能、能源透明度、供應鏈分析、杰文斯悖論
Sophia Chen | 作者
Nature | 作者
在弗吉尼亞州的庫爾佩珀縣,空氣中彌漫著干草和糞便的氣息,這里的牛數量是人類的三分之一。“我們有大片農場,大多數仍然是家族經營,并且有很多森林,”Sarah Parmelee說道,她是該縣55,000名居民之一。“這里是迷人的美國小鎮風情,”她補充道。
但是這個田園般的世外桃源正經歷21世紀的重大轉變。過去幾年里,該縣已經批準了七個大型數據中心項目的建設,這些項目將支持技術公司在生成式人工智能(AI)方面的擴張計劃。在這些巨大的建筑內部,成排的計算機服務器將用于訓練像ChatGPT這樣的對話式AI模型,并向全世界每天約數十億的請求提供答案。這種建設將會給弗吉尼亞帶來長遠的影響,每個設施可能會消耗與數萬住宅相同的電量,這可能會推高居民的用電成本,并使該地區的電力基礎設施使用超出其容量限制。帕梅利和其他社區成員對數據中心的用電需求持謹慎態度,尤其弗吉尼亞已經是全球的數據中心之都。2024年12月發布的一項審查指出,盡管數據中心帶來了經濟效益,但持續增長可能會在未來十年內使弗吉尼亞的電力需求翻倍。
“電將從哪里來?”帕梅利問道,她正在繪制該州數據中心的增長地圖,并為位于弗吉尼亞州沃倫頓的非營利組織皮埃蒙特環境委員會(Piedmont Environmental Council)工作。他們都說,“我們會從其他地區購買電力。”但可能那個區正計劃從你這里購買電力。”
類似關于AI和能源的沖突正在全球許多地方上演,這些地方的數據中心都在以創紀錄的速度涌現。大型科技公司正大力押注生成式AI,這比舊的AI模型需要更多的能量來運行,因為舊模型只是提取數據中的模式,而不生成新的文本和圖像。這使得企業集體花費數百億美元用于新建數據中心和服務器,以擴大其算力容量。
從全球視角來看,AI對未來電力需求的影響相對較小,但是對數據中心密集的地方的影響較為深遠。與其他能源密集型設施相比,如鋼鐵廠和煤礦,數據中心的空間密集度要高得多。公司傾向將數據中心的建筑建設地彼此靠近,以便共享電網和冷卻系統,并高效地傳輸信息,既包括內部傳輸,也包括傳輸到用戶。特別地,由于弗吉尼亞州提供稅收優惠,越來越多的數據中心公司在此聚集。

圖片來源:go.nature.com/439becc
“如果有了一個,很可能就會有更多,”帕梅利說。弗吉尼亞已經擁有340個這樣的設施,而帕梅利繪制的地圖顯示弗吉尼亞還有159個計劃中的數據中心或現有中心的擴建項目,據位于加利福尼亞州帕洛阿爾托的研究機構EPRI的一份報告稱,這些數據中心占該州電力使用的四分之一以上[2]。在愛爾蘭,數據中心消耗的電力超過了全國用電量的20%,其中大部分位于都柏林邊緣地區。在美國,至少有五個州的數據中心耗電量已超過10%。
更棘手的情況是,企業對其AI系統電力需求的數據缺乏透明度。“真正的問題是,我們在操作時幾乎無法獲取詳細數據和信息,”獨立研究員喬納森·庫米說,他研究計算機能源使用三十多年時間,并在加州伯靈格姆運營一家分析公司。
“我認為這個領域的研究人員都在抓狂,因為我們得不到我們需要的數據,”阿姆斯特丹自由大學研究員、荷蘭公司Digiconomist的創始人亞歷克斯·德弗里斯說,這家公司研究數字趨勢帶來的意外后果。“我們只能盡力而為,嘗試各種方法來得出一些數字。”
估算AI能源需求
由于缺乏公司的詳細數據,研究人員以兩種方式探討了AI的能源需求。2023年,德弗里斯使用了一種供應鏈(或基于市場的)方法。他查看了NVIDIA服務器的功耗,該服務器在生成式AI市場占據主導地位,并據此推算一年所需的電力。然后,他根據特定任務所需此類服務器總數的估計值乘以這一數字。
德弗里斯用這種方法估計了如果谷歌搜索使用生成式AI所需的能量。兩家能源分析公司估計,谷歌搜索使用類似ChatGPT的AI需要40到50萬臺NVIDIA A100服務器,基于這些服務器的功率需求,這將相當于每年23至29太瓦時 (TWh) 的電力。然后,根據分析師提供的每日高達90億次搜索的估算(不同來源的估計數字),德弗里斯計算出每次通過AI服務器的請求大約需要7至9瓦時(Wh)的電力。按照谷歌在2009年博客文章中報道的數字,這是普通搜索使用電力的23至30倍(參見 go.nature.com/3d8sd4t)。對此,谷歌方沒有回應。
德弗里斯說,這種計算方式感覺像是“抓住救命稻草”(grasping at straws),因為他不得不依靠來自第三方的估算。而他的數字很快過時了,因為現在的AI模型在計算成本僅為2023年模型一小部分的情況下,也可以達到相同的準確度,所以現在用于集成AI的谷歌搜索所需的服務器數量可能更低,正如美國能源分析公司SemiAnalysis(德弗里斯估算的來源數據)在給《自然》雜志的電子郵件中所寫道。
即便如此,該公司表示,評估生成式AI能耗的最佳方式仍然是監控服務器發貨量及其功率需求,這是許多分析師廣泛采用的方法。然而,要分離出僅由生成式AI使用的能量是很困難的,因為數據中心通常也需要執行非AI任務。
自下而上的估算
另一種評估AI能耗需求的方法是“自下而上”的:研究人員測量一個與AI相關的請求在一個具體數據中心中的電力需求。然而,獨立研究人員只能使用開源的AI模型進行測量,這些模型的能耗預計和私有模型(非開源)類似。
這些測試背后的概念是用戶提交一個提示,例如生成圖像或文本聊天的請求,然后Python軟件包CodeCarbon可允許用戶電腦訪問數據中心,獲取模型執行芯片的技術細節。“在運行結束時,它會提供所使用的硬件消耗了多少電力的估計值,”薩莎·盧西奧尼說,他是幫助開發CodeCarbon的AI研究員,并且在紐約市的Hugging Face工作,該公司托管了一個開放源代碼平臺,用于AI模型和數據集。
盧西奧尼和其他人發現不同的任務需要不同的能量。根據他們最新的結果,平均而言,根據文本提示生成圖像大約消耗0.5 Wh的電力,而生成文本則略少。作為比較,現代智能手機充滿電大約需要22 Wh。但存在很大的差異:較大的模型需要更多的能量(參見‘AI使用多少能量?’)。德弗里斯說,這些數字低于他論文中的數字,但這可能是因為盧西奧尼等人測試用的模型至少比支持ChatGPT的模型小一個數量級,以及AI變得越來越高效。
這些數字是一個下限,根據卡內基梅隆大學的計算機科學家艾瑪·斯特魯貝爾(Emma Strubell)的說法,他是盧西奧尼的合作研究者。他們說,“否則,公司會出來糾正我們,但他們并沒有。”此外,公司通常不會提供估算數據中心冷卻(data-centre cooling)所需電力相關的信息。據法國的數據科學家本諾瓦·科爾蒂(Beno?t Courty)所說,CodeCarbon也無法訪問某些類型的芯片的能量消耗數據,這包括谷歌的專有TPU芯片,他是CodeCarbon的維護者。

AI在不同任務上的能耗
盧西奧尼還研究了一個模型從大量數據中提取統計模式,也就是訓練生成式AI模型需要多少能量。訓練像GPT-3這樣的模型,即ChatGPT的第一個版本背后的模型,需要的能量約為千兆瓦時。但按照模型每天接收數十億次請求的計算,那么回答這些查詢所消耗的電力,能耗在太瓦時量級,依然主導AI每年的能耗需求。
上個月,盧西奧尼和其他研究人員發起了AI Energy Score項目,這是一個公共倡議,旨在比較不同任務上的AI模型的能效,并給每個模型評級。封閉源代碼模型的開發者也可以上傳測試結果,然而目前只有美國軟件公司Salesforce參與了進來,盧西奧尼說。
隨著競爭的加劇,公司對于其最新行業模型的能源需求越來越閉口不談,‘公司間共享信息的現象有所減少’,斯特魯貝爾說。如谷歌和微軟等公司的報告所稱,歸因于支持AI的數據中心建設,他們的碳排放量正在增加。(當被《自然》雜志提及缺乏透明度的批評時,包括谷歌、微軟和亞馬遜在內的公司沒有回應;相反,它們強調正在與地方當局合作,確保新建的數據中心不會影響當地的公用設施供應。)
一些政府現在要求公司提高透明度。2023年,歐盟通過了一項能源效率指令,要求能耗500千瓦功率以上的數據中心運營商每年報告其能源消耗。
全球性的預測
基于供應鏈估算方法,分析師表示數據中心目前僅占世界電力需求的一小部分。國際能源署(IEA)估計,在2022年,此類設施使用的電量為240至340太瓦時,或占世界需求的1%到1.3%,如果包括加密貨幣挖掘和數據傳輸基礎設施,這一比例將升至2% [4]。
AI的爆發將會增加這一比例,但由于許多行業的電氣化、電動汽車的增長以及空調需求的增加,預計到2050年全球電力消耗將增長超過80%,因此數據中心“在全球電力需求增長中所占的比例相對較小”,IEA報道[4]。
即使有對AI當前能源需求的估算值,也很難預測未來趨勢,庫米警告說。“沒有人知道即使是幾年后,數據中心(無論是AI還是傳統型)將使用多少電力”,他說。主要原因是未來所需的服務器和數據中心數量存在問題,在財政的激勵下,公用事業公司和技術公司通常夸大數字。并且,許多預測是基于“簡單化的假設”,他們將最近的趨勢外推到未來十年或十五年。
去年晚些時候,庫米與他人合著了一份由美國能源部資助的報告[5],該報告估計美國的數據中心目前使用國家電力的176太瓦時(4.4%),并且到2028年可能會翻倍或三倍,達到總用電量的7%到12%。
與此同時,SemiAnalysis在其2024年3月的報告中指出(參見 go.nature.com/439becc),到2028年,數據中心將消耗美國15%的電力,到2030年將消耗全球能源生產的4.5%(大約是IEA數據的兩倍)。IEA計劃下個月更新其數據,但無論其預測如何,顯然,AI對能源的影響在地方和區域層面上最為明顯。
弗吉尼亞的壓力
就在世界各地的研究人員盡力評估AI對能源的影響時,弗吉尼亞州的居民也缺少有關該地區數據中心用電情況的信息。帕梅利通過查閱新聞報道、行業出版物、稅務申報和眾包提示,追蹤了一些數據中心的電力需求,然而,要找到相關的信息非常具有挑戰性。
里士滿弗吉尼亞州立法審計審查委員會的首席立法政策分析師馬克·格里賓(Mark Gribbin)表示,當地電力公司確實知道建造數據中心的公司承諾需要多少電力。作為監督州級項目和機構的政府機構成員,他共同撰寫了那份數據中心將在十年內使弗吉尼亞的電力需求翻倍的報告[1]。但是,公司通常不會公開單個數據中心的具體電力需求。
上個月,弗吉尼亞州議員通過了一項數據中心透明度法案,該法案在《自然》雜志付印時正等待州長簽署。它不要求公司披露其電力需求,而是呼吁報告對環境的影響,涉及用水、土地使用等方面。
與此同時,弗吉尼亞州的電力基礎設施已顯示出緊張跡象。位于華盛頓特區以西的威廉王子縣的一些批準的數據中心面臨長達三年的延遲,因為電力公司無法按承諾的時間向它們供電。
JLARC的報告稱,弗吉尼亞州的公用事業公司將“非常困難”地建立足夠的基礎設施以滿足預期的數據中心需求。太陽能設施需要以2024年年度兩倍的速度增加,風力發電能力則必須超過迄今為止所有為未來發展預留的海上風電場。
在某些情況下,建造數據中心的公司正試圖自己采購電力供應。例如,去年微軟達成了一項重啟賓夕法尼亞州三里島核電站反應堆的協議,以幫助為其AI運營供電。雖然其中一些項目使用低碳或可再生能源,但一些公用事業公司和立法者正在推動發展更多的化石燃料電廠,比如燃燒天然氣的電廠,然而這將增加碳排放。
AI的需求是否會下降?
建造數據中心的熱潮基于更多人想要更頻繁地使用AI的預期。但是,“AI使用的速度和方式仍然根本不確定”,IEA分析員在去年的一篇評論文章中寫道(參見 go.nature.com/4hu2hos)。人們擔心AI表現的不一致性以及版權侵權訴訟;也不清楚將來為生成式AI提供計算能力究竟需要多少資源。

2014年1月至2024年8月美國數據中心投資情況,圖片來源:go.nature.com/4hu2hos
中國今年早些時候發布的DeepSeek-R1模型能夠以明顯的成本優勢與美國模型相匹敵。這讓一些研究人員認為現在可以創建更好的模型而不必使其變得更“大”,這可能降低數據中心的計算需求。
集智百科團隊對DeepSeek-R1模型原理的拆解:相比之下,如果生成式AI變得更加高效,人們很可能會更加頻繁地使用它——這就是所謂的杰文斯悖論(Jevons paradox),得名于十九世紀英國經濟學家威廉·斯坦利·杰文斯。他觀察到煤炭技術效率的提高也加速了開采,從而抵消了節省下的能源。
十年后,按照計劃,生成式AI的使用量可能會增長,庫爾佩珀縣目前提議的所有數據中心都將以滿負荷運行;也有可能生成式AI將成為一種相對小眾的技術,由于需求不足,一些數據中心將關閉。
“如果做出有把握的預測,但這件事本身又存在巨大的不確定性,有人就會遭受損失”,庫米說。
參考文獻:
1. Joint Legislative Audit and Review Commission. Data Centers in Virginia 2024. JLARC Report 598 (JLARC, 2024).
2. Electric Power Research Institute. Powering Intelligence: Analyzing Artificial Intelligence and Data Center Energy Consumption (EPRI, 2024).
3. De Vries, A. Joule 7, 2191–2194 (2023).
4. International Energy Agency. World Energy Outlook 2024 (IEA, 2024).
5. Shehabi, A. et al. United States Data Center Energy Usage Report (Lawrence Berkeley National Laboratory, 2024).
原標題:《AI狂歡的背后:算力的能耗,我們該擔憂嗎? | Nature報道》
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司