- +1
豆包們窮追不舍,Kimi要靠“深入推理”抵御AI巨頭沖擊
大概一個月前,OpenAI 推出了 o1 模型,不僅展示了強(qiáng)大的語言生成能力,還通過引入強(qiáng)化學(xué)習(xí),實現(xiàn)了更高層次的推理和自我糾錯能力。
9 月 16 日,月之暗面(旗下 Kimi)創(chuàng)始人楊植麟在天津大學(xué)宣懷學(xué)院做了一場分享,其中特別提到了 OpenAI 發(fā)布的 o1 模型,標(biāo)志著通用智能(AGI)范式的變化,而下一個范式,「是通過強(qiáng)化學(xué)習(xí)來做的。」
或許在當(dāng)時,或許更早,月之暗面就已經(jīng)投入到了強(qiáng)化學(xué)習(xí)的新范式之中。
但不管如何,根據(jù)「大廠青年」公眾號最新爆料,月之暗面有團(tuán)隊,在國慶期間「一直瘋狂趕進(jìn)度」,主要就是為了即將上線一個「很牛的功能」。
爆料進(jìn)一步指出,該功能與模型的深度推理有關(guān),預(yù)計將于下一個版本上線,會在搜索入口下方增加一個「深入推理」的功能開關(guān),可以回答簡單搜索無法解決的問題,甚至可以自我反思。
這是 Kimi 的 o1?
接力 OpenAI o1,通用智能新范式的一次轉(zhuǎn)移
在 OpenAI o1 之前,AI 大模型的表現(xiàn)通常局限于「快速應(yīng)答」,也就是通過預(yù)測下一個詞來生成答案。這種方式效率高,但其思維模式單一,缺少對復(fù)雜問題的深入推理和自我反思能力。

圖/ OpenAI
但隨著 OpenAI 推出的 o1 模型,這種局限性開始被突破。o1 的核心變化在于引入了強(qiáng)化學(xué)習(xí)機(jī)制,模型在面對問題做出響應(yīng)之前,會花上更多時間思考問題,來進(jìn)行深度推理和自我糾錯。
這就類似大腦的慢思考——一種被稱為「系統(tǒng) 2」的能力,o1 有了學(xué)習(xí)并完善思維過程的能力,可以嘗試不同的策略,并認(rèn)識到自己的錯誤。這種能力的提升對于 AI 的智能化帶來了顯著的影響。傳統(tǒng)模型通常只會對用戶輸入做簡單的直線型回答,而沒有「思考」過程的多樣性和深度。
例如,在處理復(fù)雜的數(shù)學(xué)題或法律案例時,模型只是依靠大量數(shù)據(jù)的模式匹配進(jìn)行預(yù)測。o1 通過強(qiáng)化學(xué)習(xí),讓 AI 可以進(jìn)行多步驟推理,類似于人類解決問題時的思維路徑——先提出假設(shè),逐步驗證推理,并且在過程中不斷自我修正錯誤。
通過這種慢思考模式,AI 不僅能給出更準(zhǔn)確的答案,還能在面對不確定性時進(jìn)行自我反思,在一定程度上避免過去模型常見的「幻覺」。
楊植麟同樣也在天津大學(xué)的演講中指出,AI 只有通過學(xué)習(xí)人類的思考過程,才能得到更好的泛化能力,而且能通過這個過程又產(chǎn)生了更多天然不存在的數(shù)據(jù),應(yīng)對更多未知的問題。

圖/上海創(chuàng)新新創(chuàng)業(yè)青年 50 人論壇
這對于最終用戶體驗的影響也是巨大的。對于普通用戶而言,推理能力的增強(qiáng)意味著在與 AI 互動時,能夠獲得更具深度、邏輯性更強(qiáng)的回答。
在 ChatGPT 中使用 o1-preview 模型就能明顯感受到,很多時候不再需要將問題簡單分解成多個小問題逐步提問,而是可以直接提出復(fù)雜的問題,AI 可以通過多步驟推理,給出綜合性的解決方案。
更重要的是,自我反思的引入讓 AI 可以像人類一樣在過程中發(fā)現(xiàn)自身的錯誤。
這種自我反思能力不僅能夠大幅減少錯誤率,還提升了用戶對 AI 的信任感。AI 不再是一個機(jī)械的應(yīng)答者,而更像是一個具備「思考」能力的智能助手,可以理解上下文、深刻分析問題,甚至在發(fā)現(xiàn)自身錯誤時及時調(diào)整,從而為用戶提供更高質(zhì)量的答案。
所以不難理解,為什么 Kimi 要做「深入推理」。事實上,國內(nèi)大模型也在向這一趨勢靠攏,在 9 月底舉辦的阿里云棲大會上,一部分大模型公司和研究機(jī)構(gòu)就達(dá)成了一定的共識,即 OpenAI 推出的 o1-preview 代表了通用智能新的進(jìn)化方式的開端。

通用智能圓桌對話,圖/云棲大會
但趨勢歸趨勢,Kimi 對于「深入推理」功能的迫切,還在于國內(nèi)市場面臨的競爭態(tài)勢在發(fā)生變化。
假期趕進(jìn)度,豆包給到Kimi的壓力越來越大
不管新功能是什么,不難看出,頂著國慶假期趕進(jìn)度,在一定程度上說明了 Kimi 團(tuán)隊的的急迫感。而這些壓力,主要還是來自于國內(nèi)其他大模型公司的激烈競爭。
經(jīng)常看 B 站的朋友應(yīng)該都會發(fā)現(xiàn),之前一直出現(xiàn)在站內(nèi)廣告中的 Kimi,存在感已經(jīng)相當(dāng)薄弱,取而代之則是滿屏的「豆包」。而字節(jié)跳動的豆包,也無疑是目前國內(nèi) AI 智能助手的領(lǐng)頭羊。
公開數(shù)據(jù)顯示,5 月上線以來,豆包連續(xù)數(shù)月一直占據(jù) App Store 免費(fèi)榜的前列位置,6 月更是長達(dá)一個月霸占榜首。即便到 10 月,豆包也仍排在第四。優(yōu)秀的產(chǎn)品體驗以及海量的推廣,豆包可以說在短時間內(nèi)迅速吸引了海量用戶,也占領(lǐng)了市場。

圖/蘋果
a16z 公布的全球 AI 產(chǎn)品前 100 榜單中,豆包同時出現(xiàn)在網(wǎng)頁端和移動端的前 50 名榜單中,顯示了其在全球市場的影響力。而與之對比,Kimi 在此榜單中未見蹤影。
不只是豆包。同為大模型初創(chuàng)公司的 MiniMax 也在迎來爆發(fā)。從 9 月以來,旗下 AI 智能助手——海螺 AI 的數(shù)據(jù)出現(xiàn)爆發(fā)式增長,月訪問量翻了超過 8 倍,月活用戶接近 500 萬。
另一方面,Kimi 過去最為人熟知的優(yōu)勢就是長文本的處理能力,能夠支持大量資料的快速處理。但隨著技術(shù)的迭代,各家大模型的上下文處理能力都發(fā)生了很大的進(jìn)步,谷歌 Gemini、阿里通義、騰訊元寶以及月之暗面 Kimi,都支持了 1000 萬 Token/字的長上下文。
而在此之后,Kimi 最明顯的「優(yōu)勢」不再明顯,同時各家的競爭也開始多元,甚至更側(cè)重于產(chǎn)品功能層面。在這個階段中,Kimi 并沒有讓用戶感知到其他更明顯的優(yōu)勢,也就很難守住 AI 智能助手「當(dāng)紅炸子雞」的市場地位。
在這種背景下,Kimi 面臨的挑戰(zhàn)是顯而易見的。
抗擊巨頭沖擊波,Kimi 需要「深入推理」
Kimi 正在開發(fā)的「深入推理」功能,無疑是一劑強(qiáng)心劑。在激烈的競爭中推出「深入推理」功能,不僅有利于 Kimi 提供能夠與領(lǐng)先者競爭的差異化功能和能力,在競爭激烈的市場中重新站穩(wěn)腳跟。
更重要的是,「深入推理」不僅意味著能夠得到更復(fù)雜問題的答案,還代表著 AI 可以在長時間對話中進(jìn)行深度思考和自我反思,將極大提升用戶在使用 Kimi 過程中的體驗,尤其是面對復(fù)雜任務(wù)的場景中。
這也符合 Kimi 一直以來的用戶畫像——學(xué)生、大學(xué)生、實習(xí)生、打工人,并且用戶更聚焦在學(xué)習(xí)、辦公協(xié)助上。相較之下,不管是豆包還是海螺 AI 其實都有更多角色扮演、情感交流的定位。

圖/ Kimi
而且對于現(xiàn)在 AI 智能助手的用戶來說,簡單的答案生成已經(jīng)不足以滿足他們的需求。越來越多的用戶期望 AI 不僅是簡單地回答問題,而是能夠幫助復(fù)雜的工作任務(wù)和日常的內(nèi)容創(chuàng)作,甚至在推理過程中自我糾錯。
伴隨用戶對 AI 要求的不斷提高,Kimi「深入推理」或許能夠幫助用戶更好地應(yīng)對他們面臨的更多現(xiàn)實問題和更高難度的任務(wù),創(chuàng)造更強(qiáng)的用戶黏性。與此同時,「深入推理」對團(tuán)隊自身的提振作用可能也不容忽視。
總而言之,Kimi 的「深入推理」功能或許將是一次關(guān)鍵的升級,對于 Kimi 來說也是一劑強(qiáng)心劑,既是在激烈的市場競爭中重新找回屬于自己的競爭優(yōu)勢,也是為通用智能的范式轉(zhuǎn)變奠定基礎(chǔ)。
或許再之后,「深入推理」將不只是一個功能,而是成為 Kimi 背后大模型的底層能力。而在國產(chǎn)大模型以及 AI 智能助手之中,目前來看,Kimi 很可能是最早邁出這一步的廠商。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司