- +1
OpenAI頭號競爭對手:大模型訓練成本最多三年將升至百億美元
AI初創企業Anthropic的CEO稱百億美元量級AI(人工智能)模型的訓練可能在明年開始。
近日,Anthropic的CEO兼總裁達里奧·阿莫代(Dario Amodei)在播客節目In Good Company中表示,目前公司正在開發的AI模型訓練成本高達10億美元,他預計,AI模型的訓練成本將在2027年之前提升到100億美元,甚至是1000億美元。
被視為OpenAI頭號競爭對手的Anthropic由一群OpenAI前員工創立。阿莫代在OpenAI工作了五年,在離開時,他已經做到了OpenAI副總裁的位置。Anthropic旗下最知名的模型是在2023年3月發布的Claude模型,今年3月,Claude 3系列正式發布。
在采訪中,阿莫代談到了自己對于AGI(通用人工智能)的看法,稱自己不認為AGI會在某一個時間點突然出現,而是會以循序漸進的方式逐漸現身:“我認為,這就像一個能夠學習和成長的人類孩子一樣,他們會變得越來越好、越來越聰明,知識越來越豐富。”
為了讓模型越變越好,就需要越來越多的資金投入。據報道,GPT-4o的訓練“僅”花費了不到1億美元,谷歌Gemini Ultra模型的訓練成本則為1.91億美元。阿莫代預計,100億美元量級模型的訓練可能會在2025年的某個時候開始,一個充滿活力的下游生態系統也會隨之出現。目前,公司已經籌集了超過80億美元的資金。
阿莫代指出,模型推出的速度和模型的成本與質量之間存在一定關系,可以把它想象成一條“權衡曲線”。公司正在努力推動這條曲線“向外移動”,以同時實現模型的快速推出、高質量和低成本:“曲線在變化,我們可以用更少的資源做更多的事情,也可以用更多的資源做更多的事情。我認為這兩種趨勢是共同存在的。”
當主持人問到“誰會在AI上賺最多的錢”時,阿莫代認為,盡管有先后順序,所有人都會分得一杯羹:“蛋糕會變得很大。就像現在,芯片公司肯定賺得最多,我認為這是因為模型的訓練先于模型的部署,而模型的部署先于其收入。所以我認為,芯片公司的估值是一個先行指標,AI公司的估值可能是一個當前指標,而下游很多東西的估值是滯后指標,但這股浪潮將影響到每個人。”
隨后,阿莫代也談到了AI芯片龍頭英偉達。面對越來越激烈的競爭,英偉達將產品發布間隔從隔一年發布大幅縮短至每年發布一次,今年市值已漲到三萬億美元以上。阿莫代指出,為了構建AI集群,包括Anthropic在內的AI企業正在為英偉達的芯片支付大筆金額;雖然尚未看到AI產生的大量收入、依然存在泡沫破滅的可能,但Anthropic選擇繼續押注看漲。
目前,以GPU為主的硬件需求仍是決定AI訓練成本的一大因素。今年6月,紅杉資本分析師David Cahn表示,AI行業每年需要為數據中心等基礎設施支付6000億美元的費用。在過去的采訪中,阿莫代曾提到,有足夠資金來訓練專業等級AI模型的公司依然不多。
今年6月,Anthropic發布了旗下性能最強的AI模型Claude 3.5 Sonnet,稱其為“迄今為止最智能的模型”。據介紹,在覆蓋閱讀、編程、數學和視覺等領域的多項性能測試中,Claude 3.5 Sonnet的性能基本全面超越了包括GPT-4o在內的一眾知名AI模型,僅在MMLU(大規模多任務語言理解)和MATH(數理)數據集上略遜于GPT-4o,且優于自家此前最強的模型Claude 3 Opus。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司