- +1
適合AI的云長什么樣?全球云計算老大哥給了一個答案

文|白 鴿
編|王一粟
“性價比、降成本、實用AI”。在亞馬遜云科技2024年度re:Invent大會上,這些詞成為了亞馬遜云科技All in生成式AI的關鍵詞。
當前,大模型行業整體的風向已經發生轉變,從原本All in預訓練大模型,逐漸轉為不斷收縮預訓練規模,加速大模型的推理和應用。
有位業內人士跟光錐智能表示:“未來全球能夠做通用大模型預訓練的玩家不會超過50家。”
這也就意味著,越來越多的企業開始轉型做大模型的推理和應用落地,而這些玩家最典型的特征,就是會更加注重投入產出比,以及如何通過大模型為自身實現降本增效。
但大模型的落地應用無疑將是一場漫長的戰爭。就像亞馬遜云科技新任 CEO Matt Garman所說:“人工智能是一場沒有終點的競賽,它將永遠持續下去。”
作為全球云計算廠商的老大哥,生成式AI無疑是亞馬遜云科技不容錯過的賽道。
為滿足更多大模型落地應用需求,在這場大會上,亞馬遜云科技全方位展示了從計算、存儲、數據庫、推理、人工智能、生成式AI應用等方面的體系化更新成果,并已經構建了從底層AI芯片,到中間大模型平臺,再到上層生成式AI應用的完整AI技術棧和基礎設施。
通過此次大會也能夠看出,從去年的相對低調,到今年年中的“轉穩為攻”,再到年尾的“全面開戰”,亞馬遜云科技在生成式AI的這場“無盡”的戰爭中,開始支棱起來了。
此外,亞馬遜首席執行官Andy Jassy在演講中也明確了亞馬遜云在生成式AI時代的發展路徑,“我們一定會優先考慮那些真正對客戶重要的技術,專注為客戶解決實際的問題。”
也就是說,從真實客戶需求出發,亞馬遜云科技通過利用自身在基礎設施、工具/模型和應用三層面的積累和實力,能夠給客戶多提供了一個“快、好、省”的選項。而這無疑能夠讓亞馬遜云科技,再次坐穩云計算行業的“鐵王座”。
全新一代芯片+訓練集群,讓大模型訓練部署更具性價比
經濟基礎決定上層建筑,云計算的基礎同樣也決定了大模型發展的未來。
Andy Jassy表示:“當生成式AI應用達到一定規模時,計算成本將至關重要。”但目前全球范圍內,大多數生成式AI應用都主要依賴某一種芯片進行計算。
因此,行業希望能夠擁有具有更高性價比的解決方案。
那么,人工智能時代真正的的基礎設施究竟是什么樣的?亞馬遜云科技高級副總裁Peter DeSantis提出構建人工智能基礎設施的兩個基本支柱:
構建更強的服務器;
構建更大規模、更高效率的服務器集群;
而不管是服務器還是服務器集群,都離不開最基礎的、高性能的GPU芯片。
Trainium是亞馬遜云科技自研的AI芯片,2020 年首次推出,曾一度被認為是訓練AI模型最具效率的芯片。在此次re:Invent大會上,亞馬遜云科技宣布Trainium2芯片,以及由Trainium2 驅動的EC2實例正式可用,并推出Trainium2 Server和Trainium2 UltraServer,這將使用戶能夠以更高的性能和成本效率訓練和部署人工智能模型。

據介紹,Amazon EC2 Trn2實例,集成了16個Trainium2芯片,由高帶寬低延遲的NeuronLink技術實現互連,單節點提供20.8 pFLOPS FP8算力,相較GPU實例,Trn2實例的性價比高出30%至40%,專為生成式AI訓練和推理而構建。
在測試中,與其他云服務商的類似產品相比,使用Amazon Trn2 EC2實例的Llama 3.1 405B 模型token生成吞吐量提高了三倍以上。
目前,Adobe、Poolside、Databricks、Qualcomm等創新公司已大規模投入使用Trainium2。
此外,Matt現場還宣布將在2025年推出Trainium3芯片。Trainium3是亞馬遜云科技基于3納米先進工藝制造的首款芯片,是Trainium2性能的兩倍,同時能效提升40%。
但面對大模型的訓練需求,單一芯片還遠遠不夠。亞馬遜云科技通過專有神經元鏈接技術NeuronLink,將64個Trainium2芯片合成了一個Ultra服務器。其計算容量是現在AI服務器的5倍。帶寬也是高達2TB每秒,但延遲只有1微秒。

此外,Anthropic也宣布,下一代Claude模型將在包含數十萬個Trainium2芯片的Project Rainier集群中進行訓練。
當前,除計算之外,影響大模型訓練和推理的,還有存儲和數據庫等軟件系統。此次大會上,亞馬遜云科技也同步更新了存儲和數據庫體系。
存儲方面,亞馬遜云科技全新發布Amazon S3 Tables,是專為Iceberg設計的全新型存儲類別,以應對快速增長的數據湖需求。
據介紹,Amazon S3 Tables可提高所有Iceberg表的性能和可擴展性。針對存儲在S3中的Parquet文件類型,可獲得3倍的查詢性能及每秒事務量10倍提升。這使得S3完全重新定義了面向數據湖的對象存儲,提供更好的性能、成本和規模擴展能力。
而當達到PB或EB級別存儲規模時,元數據(Metadata)就變得非常重要。元數據可幫助組織了解存儲在S3中的對象的信息,從而找到所需的數據。
基于此,亞馬遜云科技正式發布Amazon S3 Metadata服務,可自動從對象中提取元數據,并近實時地將其存儲在新的S3Tables桶中(Iceberg表),以支持后續使用分析工具進行元數據查詢。當對象發生變化時,S3會自動在幾分鐘內更新相應的元數據。
這無疑解決了大規模數據分析中的元數據管理挑戰,讓行業用戶能夠高效發現和利用數據而不必從事重復性的基礎設施構建工作。
此外,在數據庫方面,亞馬遜云科技全新發布了Amazon Aurora DSQL,其具有免運維體驗的分布式SQL數據庫,可在全球范圍內實現跨區域部署,并無限擴展,具備99.999%的多區域高可用性及強數據一致性,同時兼顧低延遲,是迄今為止最快的全球化部署的分布式SQL數據庫,比Google Spanner快4倍。
同時,針對NoSQL數據庫,亞馬遜云科技也發布了Amazon DynamoDB global tables的多區域強一致性功能。至此,無論客戶需要SQL還是NoSQL,亞馬遜云科技都可以提供在全球可快速擴展的高可用數據庫,支持數據強一致支持,并具備極低的讀寫延遲。
對于現階段的云廠商們來說,相比于AI大模型服務,算力無疑是最掙錢的一塊業務。但面向未來,AI大模型的服務和應用,也將至關重要。Jassy在10月份的財報回顧時表示,今年,亞馬遜的云計算業務增長態勢明顯,該公司的人工智能服務已經創造了數十億美元的年化收入。
自研+集成百余款大模型!選擇的權利,大于一切
“選擇決定一切!用模型的時候,需要有很多可選的自由!”Andy Jassy在大會上如此說道。
一句話,就已經表明了亞馬遜云科技在大模型服務上的態度,亞馬遜云科技通過集成更多的大模型產品,來讓用戶在選擇大模型使用上不受限。而這一結果,也源自于亞馬遜云科技內部在做AI應用落地的觀察。
“我們驚訝的發現,即使在亞馬遜內部,生成式AI應用的開發過程中所使用的模型種類也非常多樣化。”Andy Jassy說道,“我們一次又一次地學習到同樣的教訓,那就是——永遠不會有‘一統天下的工具’。正如數據庫領域一樣,我們過去十年一直在討論,人們使用的是多種關系型或非關系型數據庫。”
但是,這并不意味著亞馬遜云科技放棄自研大模型產品。
在演講中,Andy Jassy也提到,亞馬遜云科技內部在開發應用程序的過程中,內部開發者向亞馬遜的模型團隊提出了各種需求,包括希望模型有更低的延遲和更低的成本;望能夠進行微調,以通過標記樣本進一步優化應用性能;需要更好的圖像和視頻處理能力等等。
這些需求非常廣泛,現如今的大模型廠商并不能完全滿足這些需求。
因此,除集成大模型產品之外,亞馬遜云科技也正式發布自家新款“大模型全家桶”—Amazon Nova,涵蓋文本對話、圖片生成、視頻生成,未來不僅要實現Speech to Speech,更要Any-to-Any!
據介紹,新發布的Amazon Nova基礎模型共包括四大模型:
可用于簡單任務的超高性價比文字處理Micro模型;
三種多模態模型——低成本的Lite模型;
兼具準確性、速度和成本的Pro模型;
用于復雜的推理任務同時也可進行蒸餾定制的Premier模型。

具體到功能方面,Nova模型支持微調(Fine-tuning),蒸餾(Distillation)訓練更小的模型,讓大模型的使用效率提升的情況下,還能降低成本。同時,Nova模型與Amazon Bedrock知識庫深度集成,可用于RAG,以根據自己的數據生成響應。性能層面,Amazon Nova模型與同類模型相比,Nova在所有基準測試中都是相等或更好,極具競爭力。
現場,Andy也曬出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分數。從成績中不難看出,其在檢索增強生成(RAG)、函數調用和智能體應用方面具有較好的性能。
同時,亞馬遜云科技還重磅推出兩個全新模型:Amazon Nova Canvas高質量圖像生成模型,Amazon Nova Reel高質量視頻生成模型。其中,Amazon Nova Reel支持生成六秒的視頻,未來幾個月將支持生成兩分鐘視頻。
在后續的產品規劃中,Andy則表示,在2025年一季度左右,亞馬遜云科技將提供語音到語音的模型,允許輸入語音,獲得流暢的語音輸出。在2025年年中左右,將提供多模態輸入到多模態輸出的前沿模型,支持文本、語音、圖像及視頻。
目前,亞馬遜云科技自研的大模型產品已經上架亞馬遜云科技的“模型工廠”Amazon Bedrock,而Premier版本則將于2025年第一季度推出。
除自研大模型之外,為了能夠讓用戶不受限,亞馬遜云科技數據和人工智能部門副總裁 Swami Sivasubramanian在大會上表示:“百款基礎模型隨心挑!亞馬遜云科技宣布推出Amazon Bedrock Marketplace,用戶可以輕松調用100多款領先的大模型。”
目前Amazon Bedrock還上新了包括poolside Assistant、Stable Diffusion 3.5、Luma AI等在內的大模型。
隨著大模型的加速落地應用,推理也將成為生成式AI工作流中的核心。
Matt在大會上也表示:“推理在AI模型的應用中變得尤為重要,尤其是在處理像大型語言模型等復雜模型時,推理要求極高的計算能力和低延遲響應。”
而為了滿足更多客戶對大模型推理應用的需求,此次Amazon Bedrock也迎來多項能力的升級,使得用戶可以通過Amazon Bedrock便捷訪問Inferentia和Trainium芯片提供的推理的硬件優化資源。
比如模型蒸餾功能,其能夠提升推理速度高達500%,成本降低75%,用戶只需提供應用示例提示,Amazon Bedrock會為用戶自動完成蒸餾過程,最終獲得一個定制的、具備專業知識、合理延遲和合理性價比的蒸餾模型。
面對企業級應用,為防止大模型幻覺問題,亞馬遜云科技發布自動推理檢查功能,有助于檢測幻覺、提供可驗證的證據證明大型語言模型的準確性。
對于Agent智能體的應用,則發布Amazon Bedrock multi-agentcollaboration(多智能體協作),可以支持復雜工作流程。在性能方面,Amazon Bedrock還推出了低延遲優化推理,由此,用戶可以在使用最先進的大模型基礎上,還享受卓越的推理性能。
數據顯示,現在每天都有數萬名客戶使用Amazon Bedrock創建應用程序,比過去一年增長了5倍。而通過Amazon Bedrock,亞馬遜云科技云服務也實現既與多家模型提供商有著深厚的合作關系,同時也集成自研大模型產品,最終能夠為用戶提供最廣泛、最優質的功能選擇。
開箱即用的AI應用,加速大模型落地
有了底層算力基礎設施的支持,有了可以隨意選擇的大模型平臺工具,但想要真正開發出一個優秀的生成式AI應用,卻依然會存在非常多的困難。
不僅需要一個優秀的模型,在模型之外,還需要合適的需要合適的安全措施、流暢的語言表達、良好的用戶界面(UI)以及合理的延遲表現——用戶不希望體驗到緩慢或卡頓。此外,還需要一個優化的成本結構。
在Andy Jassy看來,在很多情況下,你會覺得自己有了一個很好的模型,稍加開發就能構建出一個優秀的生成式AI應用。但事實是,你可能只完成了70%的工作。現實是,客戶不會寬容那些仍有30%問題的應用。
因此,想要真正開發一款好用且優秀的AI應用,離不開云廠商們提供的能夠開箱即用的AI應用開發平臺工具。
亞馬遜云科技的AI應用平臺Amazon Q 為用戶提供了豐富的AI應用工具。
其中,Amazon Q Developer,此次全新全新推出三個Agent,用于生成單元測試、文檔和代碼審查,可以幫助解決這個開發人員端到端的開發問題。
Swami現場表示:“Amazon Q Developer登頂了SWE基準測試TOP1!輕松解決55.8%的軟件問題,德甲、美國航空、英國電信都在使用。”
Amazon Q Business,可以理解為是亞馬遜云科技為企業提供的數據連接工具,能夠為企業數據創建了一個索引,連接不同的業務系統、企業數據源,無論這些數據源來自亞馬遜云科技、第三方應用程序,所有這些數據都可以在安全和隱私的前提下進行更好的搜索,并跨越各種數據庫與所有企業數據進行對話。
在Q Business之下,亞馬遜此次發布了將QuickSight和Q Business的數據全部結合的新功能,通過QuickSight和Q Business以及與之相關聯的系統,例如Salesforce系統數據拉入QuickSight報告快速得到更加全面的QuickSight儀表板,使QuickSight作為BI工具變得更加強大。
此外,Amazon SageMaker由于被越來越多客戶用來處理和準備他們的數據,用于機器學習的工作負載。因此,亞馬遜云科技將其重新定位為服務數據、分析和人工智能需求的中心。

全新發布的Amazon SageMakerUnified Studio,則可以提供整合的數據和人工智能開發環境,允許客戶訪問組織中的所有數據,并使用最適合的工具。它能夠將目前亞馬遜云科技各種服務,包括Amazon EMR、Amazon Glue、Amazon Redshift、Amazon Bedrock中獨立的Studio,查詢編輯器,以及各種可視化工具等,整合到現存的Amazon SageMaker Studio中。
“Amazon SageMaker已經成為所有數據分析和AI的一站式平臺,分析工作化繁為簡,重新定義了生成式AI的游戲規則。”Swami如此說道。
目前,在全球范圍內,各大企業都希望能夠通過生成式AI實現降本增效。同時,各大全球企業巨頭,在研究生成式AI的同時,也會率先在自己內部業務場景中落地應用。
亞馬遜內部同樣如此。基于生成式AI,亞馬遜已經將生成式AI落地到企業內部多個應用場景中,包括:Alexa 語音助手改造、電商廣告創作、手掌支付、無人值守零售服務區和處方藥閱讀等。
而通過內部復雜數字生態場景所試煉出來的能力,在輸出給亞馬遜云科技的用戶,無疑將能夠給用戶帶來更好的體驗。
綜上來看,此次亞馬遜云科技的重點,則落在了大模型的推理和應用層面,正在全流程降低生成式AI構建的門檻,以及推理和應用的成本。
相比于OpenAI對AGI的追求,無疑亞馬遜云科技更注重實際,而這背后,都離不開其“一切從客戶真實需求出發”的技術研發準則。
*前述特定亞馬遜云科技生成式人工智能相關的服務僅在亞馬遜云科技海外區域可用,亞馬遜云科技中國僅為幫助您發展海外業務和/或了解行業前沿技術選擇推薦該服務。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司