- +1
DeepSeek重新定義AI發(fā)展路徑:低成本高效率模式挑戰(zhàn)傳統(tǒng)范式
當(dāng)DeepSeek在今年1月發(fā)布其R1模型時,這不僅僅是又一個AI產(chǎn)品發(fā)布。這是一個分水嶺時刻,在整個科技行業(yè)引發(fā)震動,迫使行業(yè)領(lǐng)導(dǎo)者重新思考AI開發(fā)的基本方法。
DeepSeek成就的非凡之處并非在于開發(fā)了全新能力,而是以極低成本實現(xiàn)了與科技巨頭相當(dāng)?shù)慕Y(jié)果。實際上,DeepSeek并未做任何前所未有的事情;其創(chuàng)新源于追求不同的優(yōu)先級。因此,我們現(xiàn)在正經(jīng)歷著沿著兩個平行軌道的快速發(fā)展:效率和算力。
隨著DeepSeek準(zhǔn)備發(fā)布R2模型,同時面臨美國可能實施更嚴(yán)格芯片限制的威脅,回顧其如何獲得如此關(guān)注變得重要。
**在約束中創(chuàng)新**
DeepSeek的崛起如此突然且戲劇化,令我們著迷,因為它展示了創(chuàng)新在重大約束下仍能蓬勃發(fā)展的能力。面對美國出口管制限制獲取尖端AI芯片,DeepSeek被迫尋找AI發(fā)展的替代路徑。
當(dāng)美國公司通過更強(qiáng)大的硬件、更大的模型和更好的數(shù)據(jù)追求性能提升時,DeepSeek專注于優(yōu)化現(xiàn)有資源。它以卓越的執(zhí)行力實施已知理念——而在執(zhí)行已知概念并做好這一點上確實存在新穎性。
這種效率優(yōu)先的思維產(chǎn)生了令人印象深刻的結(jié)果。據(jù)報道,DeepSeek的R1模型以僅5-10%的運營成本就能匹敵OpenAI的能力。根據(jù)報告,DeepSeek V3前身的最終訓(xùn)練僅花費600萬美元——前特斯拉AI科學(xué)家Andrej Karpathy稱之為相比美國競爭對手?jǐn)?shù)千萬或數(shù)億美元投入的"玩笑預(yù)算"。更令人震驚的是,據(jù)報OpenAI在訓(xùn)練最新"Orion"模型上花費5億美元,而DeepSeek僅用560萬美元就實現(xiàn)了更優(yōu)的基準(zhǔn)測試結(jié)果——不到OpenAI投資的1.2%。
如果你因為相信這些令人難以置信的結(jié)果是在DeepSeek無法獲得先進(jìn)AI芯片的嚴(yán)重劣勢下實現(xiàn)的而興奮不已,我很遺憾地告訴你,這種敘述并不完全準(zhǔn)確(盡管這是個好故事)。最初的美國出口管制主要針對計算能力,而非內(nèi)存和網(wǎng)絡(luò)——這是AI開發(fā)的兩個關(guān)鍵組件。
這意味著DeepSeek獲得的芯片質(zhì)量并不差;其網(wǎng)絡(luò)和內(nèi)存能力使DeepSeek能夠在多個單元間并行化操作,這是高效運行大型模型的關(guān)鍵策略。
這一點,結(jié)合中國對控制整個AI基礎(chǔ)設(shè)施垂直堆棧的國家推動,產(chǎn)生了許多西方觀察者未曾預(yù)料的加速創(chuàng)新。DeepSeek的進(jìn)步是AI發(fā)展的必然部分,但它們將已知進(jìn)步提前了幾年,這相當(dāng)了不起。
**實用主義勝過流程**
除了硬件優(yōu)化,DeepSeek的訓(xùn)練數(shù)據(jù)方法代表了對傳統(tǒng)西方實踐的另一次偏離。據(jù)報道,DeepSeek沒有僅依賴網(wǎng)絡(luò)抓取內(nèi)容,而是大量利用合成數(shù)據(jù)和其他專有模型的輸出。這是模型蒸餾的經(jīng)典例子,即從真正強(qiáng)大的模型中學(xué)習(xí)的能力。然而,這種方法引發(fā)了可能令西方企業(yè)客戶擔(dān)憂的數(shù)據(jù)隱私和治理問題。盡管如此,它強(qiáng)調(diào)了DeepSeek對結(jié)果而非流程的整體實用主義關(guān)注。
合成數(shù)據(jù)的有效使用是關(guān)鍵差異化因素。合成數(shù)據(jù)在訓(xùn)練大型模型方面可能非常有效,但必須謹(jǐn)慎;某些模型架構(gòu)處理合成數(shù)據(jù)比其他架構(gòu)更好。例如,像DeepSeek使用的基于變換器的專家混合(MoE)架構(gòu)在整合合成數(shù)據(jù)時往往更穩(wěn)健,而像早期Llama模型中使用的更傳統(tǒng)密集架構(gòu)在合成內(nèi)容訓(xùn)練過多時可能會經(jīng)歷性能下降甚至"模型崩潰"。
這種架構(gòu)敏感性很重要,因為合成數(shù)據(jù)相比真實世界數(shù)據(jù)引入了不同的模式和分布。當(dāng)模型架構(gòu)不能很好地處理合成數(shù)據(jù)時,它可能學(xué)習(xí)合成數(shù)據(jù)生成過程中存在的捷徑或偏見,而非可泛化的知識。這可能導(dǎo)致在真實世界任務(wù)上的性能降低、幻覺增加或面對新情況時的脆弱性。
盡管如此,據(jù)報DeepSeek的工程團(tuán)隊從最早的規(guī)劃階段就專門設(shè)計了考慮合成數(shù)據(jù)集成的模型架構(gòu)。這使公司能夠利用合成數(shù)據(jù)的成本優(yōu)勢而不犧牲性能。
**市場反響**
為什么這一切都很重要?除了股市反應(yīng),DeepSeek的出現(xiàn)已在行業(yè)領(lǐng)導(dǎo)者中引發(fā)實質(zhì)性戰(zhàn)略轉(zhuǎn)變。
以O(shè)penAI為例:Sam Altman最近宣布計劃發(fā)布公司自2019年以來首個"開放權(quán)重"語言模型。對于一家建立在專有系統(tǒng)基礎(chǔ)上的公司來說,這是相當(dāng)顯著的轉(zhuǎn)向。看起來DeepSeek的崛起,加上Llama的成功,給OpenAI領(lǐng)導(dǎo)者帶來了沉重打擊。在DeepSeek出現(xiàn)僅一個月后,Altman承認(rèn)OpenAI在開源AI方面"站在了歷史的錯誤一邊"。
據(jù)報OpenAI年運營支出70-80億美元,來自DeepSeek等高效替代方案的經(jīng)濟(jì)壓力已變得無法忽視。正如AI學(xué)者李開復(fù)直言不諱地說:"你每年花費70或80億美元,造成巨大虧損,而這里有一個競爭對手推出免費的開源模型。"這必然要求改變。
這一經(jīng)濟(jì)現(xiàn)實促使OpenAI尋求400億美元的大規(guī)模融資輪次,公司估值達(dá)到前所未有的3000億美元。但即使擁有充足資金,根本挑戰(zhàn)依然存在:OpenAI的方法比DeepSeek的資源密集度要高得多。
**超越模型訓(xùn)練**
DeepSeek加速的另一個重要趨勢是向"測試時計算"(TTC)的轉(zhuǎn)變。由于主要AI實驗室現(xiàn)在已在互聯(lián)網(wǎng)上大部分可用公共數(shù)據(jù)上訓(xùn)練了它們的模型,數(shù)據(jù)稀缺正在減緩預(yù)訓(xùn)練的進(jìn)一步改進(jìn)。
為了解決這個問題,DeepSeek宣布與清華大學(xué)合作,實現(xiàn)"自主原則批評調(diào)優(yōu)"(SPCT)。這種方法訓(xùn)練AI開發(fā)自己判斷內(nèi)容的規(guī)則,然后使用這些規(guī)則提供詳細(xì)批評。系統(tǒng)包含一個內(nèi)置"判斷器",實時評估AI的答案,將響應(yīng)與核心規(guī)則和質(zhì)量標(biāo)準(zhǔn)進(jìn)行比較。
這一發(fā)展是AI系統(tǒng)自主自我評估和改進(jìn)運動的一部分,其中模型使用推理時間來改進(jìn)結(jié)果,而不是簡單地在訓(xùn)練期間使模型更大。DeepSeek稱其系統(tǒng)為"DeepSeek-GRM"(通用獎勵建模)。但是,與其模型蒸餾方法一樣,這可能被認(rèn)為是希望與風(fēng)險的混合。
例如,如果AI開發(fā)自己的判斷標(biāo)準(zhǔn),存在這些原則偏離人類價值觀、倫理或背景的風(fēng)險。規(guī)則可能最終過于嚴(yán)格或有偏見,優(yōu)化風(fēng)格而非實質(zhì),和/或強(qiáng)化錯誤假設(shè)或幻覺。此外,沒有人在環(huán)路中,如果"判斷器"有缺陷或不對齊,可能會出現(xiàn)問題。這是一種AI自說自話,沒有強(qiáng)有力的外部基礎(chǔ)。除此之外,用戶和開發(fā)者可能不理解AI為什么得出某個結(jié)論——這涉及更大的擔(dān)憂:是否應(yīng)該允許AI僅基于自己的邏輯來決定什么是"好"或"正確"?這些風(fēng)險不應(yīng)被忽視。
同時,這種方法正在獲得關(guān)注,因為DeepSeek再次建立在他人工作基礎(chǔ)上(想想OpenAI的"批評和修訂"方法、Anthropic的憲法AI或自獎勵代理研究),創(chuàng)造了可能是商業(yè)努力中SPCT的首個全棧應(yīng)用。
這可能標(biāo)志著AI自主性的強(qiáng)大轉(zhuǎn)變,但仍需要嚴(yán)格的審計、透明度和保障措施。這不僅僅是模型變得更聰明,而是它們在開始沒有人類護(hù)欄的自我批評時保持對齊、可解釋和可信。
**展望未來**
考慮到所有這些,DeepSeek的崛起標(biāo)志著AI行業(yè)向并行創(chuàng)新軌道的更廣泛轉(zhuǎn)變。雖然公司繼續(xù)為下一代能力構(gòu)建更強(qiáng)大的計算集群,但也將通過軟件工程和模型架構(gòu)改進(jìn)來尋找效率提升,以抵消AI能耗挑戰(zhàn),這遠(yuǎn)超發(fā)電能力。
公司正在關(guān)注。例如,微軟已暫停全球多個地區(qū)的數(shù)據(jù)中心開發(fā),重新校準(zhǔn)向更分布式、高效的基礎(chǔ)設(shè)施方法。雖然仍計劃在本財年在AI基礎(chǔ)設(shè)施上投資約800億美元,但公司正在重新分配資源以響應(yīng)DeepSeek向市場引入的效率提升。
Meta也做出了回應(yīng),發(fā)布了最新的Llama 4模型系列,標(biāo)志著其首次使用MoE架構(gòu)。Meta在推出Llama 4時特別將DeepSeek模型納入其基準(zhǔn)比較,盡管比較兩者的詳細(xì)性能結(jié)果未公開詳細(xì)披露。這種直接競爭定位標(biāo)志著格局的轉(zhuǎn)變,中國AI模型(阿里巴巴也在參與)現(xiàn)在被硅谷公司認(rèn)為值得作為基準(zhǔn)。
在如此短時間內(nèi)有如此多變化,具有諷刺意味的是,旨在維持美國AI主導(dǎo)地位的美國制裁可能反而加速了它們試圖遏制的創(chuàng)新。通過限制材料獲取,DeepSeek被迫開辟新路徑。
展望未來,隨著行業(yè)在全球范圍內(nèi)持續(xù)發(fā)展,所有參與者的適應(yīng)性將是關(guān)鍵。政策、人員和市場反應(yīng)將繼續(xù)改變游戲規(guī)則——無論是取消AI擴(kuò)散規(guī)則、新的技術(shù)采購禁令還是其他完全不同的措施。我們彼此學(xué)到什么以及如何回應(yīng)將值得關(guān)注。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司