- +1
獨家|亞馬遜披露多年自研芯片歷程,與英偉達合作詳情
·AWS正與英偉達合作推動Ceiba項目。英偉達將擁有自己的超級計算機供自己使用,并提供DGX云服務(訓練即服務)給他們的最終客戶,AWS也將為自己的客戶提供英偉達GH200 NVL32的多節點集群。
·對于Trainium 2及Graviton 4在中國市場的推出時間,AWS計算和網絡副總裁大衛?布朗在接受澎湃科技采訪時表示還未有明確時間表。
在11月26日-12月1日期間舉辦的2023亞馬遜云科技re:Invent全球大會上,亞馬遜云科技(AWS)公布了其在硬件方面的諸多努力,推出了專為訓練人工智能系統而設計的第二代芯片Trainium 2,以及通用Graviton 4處理器。英偉達CEO黃仁勛也到現場站臺,宣布AWS成為第一家在云端配備英偉達最新GH200 Grace Hopper超級芯片的云廠商。
對于Trainium 2及Graviton 4在中國市場的推出時間,AWS計算和網絡副總裁大衛?布朗(David Brown)在大會期間接受澎湃科技(www.kxwhcb.com)采訪時表示還未有明確時間表,“我不能100%確定時間。我們對所有實例的標準做法是,選擇全球的幾個地區首次推出,然后迅速查看其他可能推出的地區,這個過程基于客戶需求和其他一些因素。在未來的幾個月內,我們將更清楚何時進入中國市場。”

Amazon Graviton4 和Amazon Trainium(原型)。
在為期5天的會議期間,生成式人工智能幾乎是每場論壇都會提及的高頻詞匯,成本優化則是相關熱門話題。在此期間,記者對話亞馬遜云科技數據庫、數據分析和機器學習全球副總裁斯瓦米·西瓦蘇布拉馬尼安(Swami Sivasubramanian)和大衛?布朗,談及與英偉達的合作詳情,AWS自研芯片的發展過程,以及當下對生成式人工智能發展熱潮的思考。
“成為運行英偉達GPU的最佳場所”
“我們與英偉達密切合作了很長時間,投入了大量資源,將最新的英偉達GPU引入AWS(亞馬遜云科技)。”布朗表示,當你運行英偉達GPU時,要做得好非常具有挑戰性。現在正在發生的事情是,這些GPU變得非常復雜,從工程角度來看,運行它們變得非常困難。“我認為AWS在如何運行這些GPU方面確實勝過其他所有競爭對手,我們也希望成為運行英偉達GPU的最佳場所。”
黃仁勛在大會現場的對話中提到了一個他稱之為“驚人的”統計數據:僅在過去幾年中,AWS在云中部署了200萬個使用Ampere和Hopper架構的GPU,這相當于一個3000 EFLOPS(每秒進行百億億次浮點運算)運算性能的超級計算機。
“擁有一臺百億億級次浮點運算性能的超級計算機就非常令人羨慕,而AWS相當于擁有3000臺這樣的超級計算機。”黃仁勛說,“這才只是一個開始。我們與AWS的合作仍在以驚人的速度增長。每個季度,我們都會為AWS部署超過1 ZFLOPS(1 ZFLOPS=1000 EFLOPS)的計算能力,這是一個令人難以置信的數字,我們兩個團隊建立了一整套新的基礎設施。”
與此同時,AWS實際上一直在投資自己的定制芯片,從2013年推出首顆Nitro 1芯片至今,AWS是最先涉足自研芯片的云廠商,已擁有虛擬化芯片、服務器芯片、人工智能機器學習自研芯片3條產品線。
為何“雙管齊下”,一邊與英偉達合作更加緊密,一邊自研芯片?
布朗解釋稱,一切都是為了確保客戶有選擇。“選擇是如此重要。它真的推動了正向的客戶體驗,并且從長遠來看,這將帶來最好的結果,因為所有這些選擇都在獨立創新,彼此競爭。在某些情況下,一些工作負載可能在Trainium上,而在其他情況下可能在英偉達上,所以最終可能不會有一個贏家,始終會有英偉達、Trainium和市場上的其他選擇。”
對于為何AWS有自研的Titan大模型,同時又投資OpenAI的競爭對手Anthropic,在AWS平臺同時提供Claude 2大模型等選項,西瓦蘇布拉馬尼安也給了相似的答案。“它們實際上具有不同的能力,Claude 2具有非常好的推理能力,而Titan模型非常靈活,兩者在性能成本等方面也很不同。我認為擁有更多的選擇從客戶角度來看是一件好事,這也是激勵我們的原因。”
AWS正與英偉達合作推動Ceiba項目,計劃構建全球最快的GPU驅動的AI超級計算機——配置16384顆英偉達H200超級芯片,能處理65 EFLOPS速度等級的AI運算,為英偉達研發團隊提供服務。
對于記者詢問Ceiba項目是否只服務于英偉達,布朗表示,英偉達將擁有自己的超級計算機供自己使用,并提供DGX云服務(訓練即服務,AI-training-as-a-service)給他們的最終客戶,AWS也將為自己的客戶提供英偉達GH200 NVL32的多節點集群。
“繼續成本優化”
“我在這周進行的對話實際上都關于如何繼續成本優化。生成式人工智能如此新穎,大家都在努力弄清楚如何在業務中應用它,但有兩件事必須考慮清楚。”布朗說。
第一是構建概念驗證,真正測試生成式人工智能對業務的潛在影響。第二,當企業擁有了生成式人工智能解決方案,必須確保它可以適應企業的損益表。如果運行成本過高,實際上無法部署,因為它將沒有用處。布朗表示,“無論是通過開發模型還是Trainium芯片這樣的方式,我們都希望真正降低生成式人工智能所需的成本。”
西瓦蘇布拉馬尼安也在對話中表示,企業需要的不僅僅是更大的模型,更關鍵的是投資回報。“比如我正在構建生成式人工智能應用程序,希望增加收入或降低成本,但我不想在推理上花費巨額資金,因為這意味著我可能無法產生盈利。當我們與這些企業合作時,他們會意識到其實際上需要的是一個較小的模型以適應特定用例,這樣就可以在不使用大型模型的情況下從生成式人工智能中獲得價值。他們實際上從一個非常龐大的模型過渡到了經過精細調整的較小模型,并取得了更低的成本、更高的準確性和更好的性能。”
在回顧AWS從2013年推出Nitro芯片的歷程時,被高頻提及的也是成本優化。“摩爾定律(注:摩爾定律指集成電路上可容納的晶體管數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。)早在十幾年前就有所減弱,就像人們說的,我們不可能讓這些芯片再快一點了,因為如果再添加更多的晶體管,就無法保持冷卻效果,這是一個物理問題。我們正處于這樣一個旅程中,我們需要思考,如何持續提高性能、降低成本?”布朗表示,“除非我們真的涉足芯片并在硬件上進行創新,否則我們所能做的事情就會受到限制,我們不能僅僅依賴于行業中現有的東西。因此,我們首先從Nitro開始這個旅程。”
布朗繼續分享道,“然后我們想,是否真的可以構建一款服務器芯片?這個想法是,我們可以構建一款基于Arm架構的芯片。Arm架構就在每個人的手機上,它的功耗很低,因為其整個芯片的架構都是為全天電池運行而設計,它還有一個強大的生態系統,有很多為手機編寫的應用程序。我們當時認為Arm架構是我們構建服務器芯片的完美選擇,這就是Graviton的由來。”
推理芯片Inferentia和訓練芯片Trainium則可以追溯到5年前,當時布朗團隊認為,機器學習中的絕大部分成本實際上是推理,如果能夠構建一個推理芯片并降低推理成本,客戶就可以完成更多推理并改進應用程序,訓練方面也同樣。“現在由于生成式人工智能的原因,訓練占主導地位,但隨著更多人使用生成式人工智能,推理的工作負載會在時間的推移中恢復,Inferentia 2將非常適合這個用途。”布朗說。
目前這些工作已經帶來了回報,據布朗介紹,Graviton比當時的可用產品計算性能提升了40%,Graviton 2比前一代提高了25%,Graviton 3比Graviton 2更優,現在Graviton 4至少比Graviton 3提高了30%。

從左至右依次為Graviton 1、Graviton 2、Graviton 3、Graviton 4。圖片來源:澎湃科技
“這就是我們在Graviton上看到的,我們正在改變芯片的架構方式,改變簡化芯片的方式,改變為芯片提供電源的方式,同時還有許多可以提高性能的方法。因此,摩爾定律的消失并不意味著我們不再能通過創新和加速性能的方式來發展。”布朗說。
解決算力需求劇增帶來的環境問題
對于2024年生成式人工智能如何發展有何判斷?西瓦蘇布拉馬尼安對澎湃科技表示,這些模型將因其推理能力等的不斷提升而變得越來越強大,因此我們將會看到更多的應用。
而隨著生成式人工智能應用到各個領域,對算力的需求也會進一步劇增,如何解決高算力帶來的能源消耗與環保問題?
據布朗透露,到2040年,亞馬遜公司整體將實現碳中和,但這包括貨車、飛機等,因此,在碳足跡方面,AWS將在2030年實現碳中和。
“這意味著我們在數據中心使用的電力將來自綠色能源,如風、水、太陽能,或者如果我們必須消耗不來自綠色能源的電力,我們將購買碳抵消來確保該電力從碳中和的角度來看是綠色的。我們正在按計劃實現2030年的碳中和目標,到2025年,我們實際上產生的清潔水將比消耗的更多。”布朗說。
那么在芯片方面如何更加節能?布朗說,“最好的辦法就是不使用電力。因此,使用Graviton會比同類芯片少用60%的電來完成相同的工作負載,這意味著在我們工作負載上所用的能量要比在其他云服務提供商上看到的要少得多。如果看Trainium 2,它實際上使用的能量比Trainium 1完成相同工作負載要少兩倍。”
布朗透露,英偉達也在關注這個問題,“我們也一直在與英特爾、AMD等交流,討論他們使用的功率?盡管對算力的需求正在以瘋狂的速度增長,但我們確實需要一個更加節能的世界,這是有限的資源。”





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司