- +1
李彥宏改錯了?!文心大模型走向開源,百度要決勝AI未來
李彥宏,認錯了。
2月14日早上十點,百度的微信公眾號發布了一篇非常簡短的推文,其內容只有一句話:我們將在未來幾個月中陸續推出文心大模型4.5系列,并于6月30日起正式開源。

圖源:百度
沒有故弄玄虛,沒有留下懸念,百度就這樣決定將自己最先進的AI大模型開源,很難想象這還是那個曾經堅持“閉源”才是未來的百度。再結合前幾天百度宣布文心大模型全模型免費開放使用等消息,不難看出在短短的一個月時間里,百度就在對AI大模型的開放態度上,來了個一百八十度的大轉向。
畢竟,百度的CEO李彥宏可以說曾經在2024 年世界人工智能大會以:“開源模型實際上是一種 ‘智商稅’,閉源模型在性能和推理成本上都優于開源模型。”“開源模型會越來越落后”等言論引起廣泛討論,甚至一度掀起業內對于AI大模型的開源閉源之爭。
不過,最終的結果我想大家都已經看到,百度從閉源走向開源,最終還是跳上了一趟“晚班車”。
AI大模型的閉源與開源之爭
作為一個長期關注AI大模型行業的編輯,其實我對于李彥宏的觀點也是部分認可的。AI大模型是一個需要長期且巨額投入的行業,很少有公司可以一直頂著巨額的虧損進行運營,所以通過出售閉源模型的API和接受定制模型訂單來回籠資金,基本上就是AI應用真正落地開花前僅有的盈利方式。
而且閉源模型可以更好的進行優化,以至于目前全球范圍內領先的AI大模型多數都是閉源模型,比如OpenAI的ChatGPT、Google的Gemini和Anthropic的Claude等,這些常年霸占多模態AI排行榜前五的AI都是閉源AI,在性能與使用體驗上確實有著不少優勢。

圖源:OpenAI
在2025年的春節到來之前,閉源模型比開源模型更先進的說法基本上得到了普遍認可。實際上那些排名靠前的開源AI大模型,背后大多也都有閉源模型在支持,比如在最近一次測試中排名全球第七名的Qwen-2.5-Max,就是依托于阿里的通義大模型裁剪出來的簡化版模型。
在DeepSeek發布之前,參數量最龐大的開源模型是Meta的LLama 3,其最高版本為405B,也就是擁有405億的訓練參數。即使如此,LLama 3在測試中也無法戰勝GPT-4和claude 3 Opus,僅排名第五。
直到參數量高達671B的DeepSeek以蠻橫的力量,直接把“閉源才是AI大模型的未來”這句話給粉碎,作為一個開源大模型,DeepSeek在Chatbot的測試中,以1361分的成績與ChatGPT-4o并列第三,并且超過了ChatGPT-o1的1352分成績。
可以說,這是第一次有開源AI大模型,在全類別榜單中來到前三的位置,試問這個結果如何不讓人感到驚訝呢?當然,更讓人驚訝的還是DeepSeek選擇將這個超強模型進行全面開源,甚至使用的是最「open」的開源協議。

圖源:DeepSeek
在最近半個月時間里,可以看到已經無數的品牌、產品在接入DeepSeek,幾乎所有云服務供應商都加班加點完成了DeepSeek的服務器部署,為了攬客甚至大量發放免費額度,吸引用戶使用。
DeepSeek讓整個市場都看到了開源AI大模型的可怕,在短短半個月里就完成了其他AI大模型都做不到的全生態覆蓋。甚至在海外媒體的報道中,印度、英國等國家都有圍繞DeepSeek的開源模型開發自己的AI大模型的打算,小到手機大到國家,完全可以用燎原之勢來形容。
DeepSeek的成功也讓許多人開始重新衡量閉源與開源的側重,OpenAI的CEO奧特曼就不止一次表示自己錯了,“我站在歷史錯誤的一邊”,這是奧特曼在回答有關DeepSeek問題時給出的回答,直接承認了此前的閉源策略是錯誤的,并在隨后表示OpenAI正在制定一個開源策略。

圖源:維基百科
“人非圣賢孰能無過”,在我看來奧特曼是如此,李彥宏也是如此,犯錯不可怕,只要在意識到走錯路后及時轉回正確的道路,那么一切都還有挽救的機會。這也是為什么百度會在不到一個月的時間里,如此迅速地通過一系列決策,將文心大模型的門徹底敞開,李彥宏用實際行動證明著百度仍然有足夠的魄力來應對未來的挑戰。
可以說,DeepSeek的開源,所帶來的不只是一個AI模型,而是一個截然不同的AI行業。
至于AI大模型未來是否會徹底走向開源,個人的觀點是不太可能,更有可能形成開源為基礎、半開源為中堅、閉源為塔頂的金字塔型結構。某種程度上,其實和當年的智能手機生態大戰相似,開源的安卓與閉源的iOS,兩者最終誰都無法取代誰,而是在持續的競爭中共同組成了現在的智能手機生態。
屆時的AI行業,或許也會像今天的智能手機市場一樣,開源模型(安卓)負責普及和更新底層模塊,半開源定制模型負責進一步優化創新(澎湃OS、ColorOS等),閉源模型(iOS)負責提供高性能和高安全性的服務。既擁有開源的普惠特性,又兼容閉源的高性能與安全,對于一個涉及全球所有產業的行業而言,這樣的結構或許才更具有活力。
跳上「開源」列車,百度決勝AI未來
百度有機會嗎?答案是肯定的,事實上百度從閉源生態上跳車的速度之快,超出了多數人的預料,以至于百度在2月13日和14日分別公布將文心一言完全免費和文心大模型開源后,其股價就開始暴漲,證明市場對于百度的動作有著很高的認可度。
事實上,AI行業還遠沒有到蓋棺論定的時候,DeepSeek用開源證明了整個市場對AI的渴望以及開源的潛力,但是AI模型離真正覆蓋全行業,并且應用落地其實還有很長一段路要走。
就拿各種接入DeepSeek的產品來說,大多是做了個入口,通過轉接到服務器的方式提供問答服務,與產品本身幾乎沒有互動,甚至被人吐槽還不如直接下載一個DeepSeek app,操作步驟還少一些。

圖源:微博
當下的DeepSeek生態大爆發里,99%的應用和產品或許都可以用“湊熱鬧”來形容,想要真正體會到DeepSeek在應用層面所帶來的改變,還得至少幾個月的時間。所以,這就給了其他AI公司追趕的可能,如果文心4.5真的如傳聞那樣大幅度降低了推理成本,并且在多模態等方面擁有媲美DeepSeek-R1的性能,那么在百度的龐大用戶基礎和廣泛合作伙伴的支持下,并非沒有重新突圍的機會。
老實說,在國內的一眾AI企業中,百度與阿里是少數擁有全場景布局的企業,他們的根須觸及我們生活的方方面面,不僅可以加速自身的模型落地,也可以根據需求為某個行業和應用做出針對性的優化和微調。
而在選擇了開源這條道路后,百度的AI商用策略也會發生明顯改變,比如提供更低成本的AI模型定制方案、超低成本的API接入等,對于一些沒有技術團隊的企業來說,與其從頭開始折騰DeepSeek,不如選擇與更成熟的百度合作。
你問為什么不去找DeepSeek合作?很簡單,因為DeepSeek幾乎讓大多數企業都吃了閉門羹,雖然你看到很多產品都聯動DeepSeek,實際上都只是接入了第三方的API,DeepSeek本身的API在短暫開放購買后又迅速關閉,并且公司也拒絕了大多數企業的合作請求。
換言之,DeepSeek暫時還沒有商業化的打算,不過這也不奇怪,如果真的打算現在就開始走商業化,那么DeepSeek-R1就不會采用近乎完全開源的方式公布。
對于百度來說,這是機會,也是挑戰,畢竟如果你的開源模型最終表現還不如DeepSeek-R1,那么更基礎的開源底層,仍然會是DeepSeek的天下。當然,現在談論這些也為時尚早,畢竟我們還不清楚文心模型會以怎樣的方式開源,是類似于DeepSeek?還是Qwen和LLama的形式?
不管怎么說,從閉源跳車的百度,現在也已經坐上了開源的快車,并且也在一定程度上扭轉了其在用戶和開發者心中的形象,在整個AI行業都仍處于探索階段的當下,百度來得還不算太晚。

本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司