OpenAI頭號競爭對手：大模型訓練成本最多三年將升至百億美元

澎湃新聞記者胡含嫣

2024-07-08 18:35

來源：澎湃新聞

? 10%公司 >

AI初創企業Anthropic的CEO稱百億美元量級AI（人工智能）模型的訓練可能在明年開始。

近日，Anthropic的CEO兼總裁達里奧·阿莫代（Dario Amodei）在播客節目In Good Company中表示，目前公司正在開發的AI模型訓練成本高達10億美元，他預計，AI模型的訓練成本將在2027年之前提升到100億美元，甚至是1000億美元。

被視為OpenAI頭號競爭對手的Anthropic由一群OpenAI前員工創立。阿莫代在OpenAI工作了五年，在離開時，他已經做到了OpenAI副總裁的位置。Anthropic旗下最知名的模型是在2023年3月發布的Claude模型，今年3月，Claude 3系列正式發布。

在采訪中，阿莫代談到了自己對于AGI（通用人工智能）的看法，稱自己不認為AGI會在某一個時間點突然出現，而是會以循序漸進的方式逐漸現身：“我認為，這就像一個能夠學習和成長的人類孩子一樣，他們會變得越來越好、越來越聰明，知識越來越豐富。”

為了讓模型越變越好，就需要越來越多的資金投入。據報道，GPT-4o的訓練“僅”花費了不到1億美元，谷歌Gemini Ultra模型的訓練成本則為1.91億美元。阿莫代預計，100億美元量級模型的訓練可能會在2025年的某個時候開始，一個充滿活力的下游生態系統也會隨之出現。目前，公司已經籌集了超過80億美元的資金。

阿莫代指出，模型推出的速度和模型的成本與質量之間存在一定關系，可以把它想象成一條“權衡曲線”。公司正在努力推動這條曲線“向外移動”，以同時實現模型的快速推出、高質量和低成本：“曲線在變化，我們可以用更少的資源做更多的事情，也可以用更多的資源做更多的事情。我認為這兩種趨勢是共同存在的。”

當主持人問到“誰會在AI上賺最多的錢”時，阿莫代認為，盡管有先后順序，所有人都會分得一杯羹：“蛋糕會變得很大。就像現在，芯片公司肯定賺得最多，我認為這是因為模型的訓練先于模型的部署，而模型的部署先于其收入。所以我認為，芯片公司的估值是一個先行指標，AI公司的估值可能是一個當前指標，而下游很多東西的估值是滯后指標，但這股浪潮將影響到每個人。”

隨后，阿莫代也談到了AI芯片龍頭英偉達。面對越來越激烈的競爭，英偉達將產品發布間隔從隔一年發布大幅縮短至每年發布一次，今年市值已漲到三萬億美元以上。阿莫代指出，為了構建AI集群，包括Anthropic在內的AI企業正在為英偉達的芯片支付大筆金額；雖然尚未看到AI產生的大量收入、依然存在泡沫破滅的可能，但Anthropic選擇繼續押注看漲。

目前，以GPU為主的硬件需求仍是決定AI訓練成本的一大因素。今年6月，紅杉資本分析師David Cahn表示，AI行業每年需要為數據中心等基礎設施支付6000億美元的費用。在過去的采訪中，阿莫代曾提到，有足夠資金來訓練專業等級AI模型的公司依然不多。

今年6月，Anthropic發布了旗下性能最強的AI模型Claude 3.5 Sonnet，稱其為“迄今為止最智能的模型”。據介紹，在覆蓋閱讀、編程、數學和視覺等領域的多項性能測試中，Claude 3.5 Sonnet的性能基本全面超越了包括GPT-4o在內的一眾知名AI模型，僅在MMLU（大規模多任務語言理解）和MATH（數理）數據集上略遜于GPT-4o，且優于自家此前最強的模型Claude 3 Opus。

責任編輯：王杰

圖片編輯：蔣立冬

校對：張亮亮

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

我要舉報

#AI #Anthropic #OpenAI