下載客戶端

登錄

豆包們窮追不舍，Kimi要靠“深入推理”抵御AI巨頭沖擊

2024-10-11 11:44

來源：澎湃新聞·澎湃號·湃客

大概一個月前，OpenAI 推出了 o1 模型，不僅展示了強(qiáng)大的語言生成能力，還通過引入強(qiáng)化學(xué)習(xí)，實現(xiàn)了更高層次的推理和自我糾錯能力。

9 月 16 日，月之暗面（旗下 Kimi）創(chuàng)始人楊植麟在天津大學(xué)宣懷學(xué)院做了一場分享，其中特別提到了 OpenAI 發(fā)布的 o1 模型，標(biāo)志著通用智能（AGI）范式的變化，而下一個范式，「是通過強(qiáng)化學(xué)習(xí)來做的。」

或許在當(dāng)時，或許更早，月之暗面就已經(jīng)投入到了強(qiáng)化學(xué)習(xí)的新范式之中。

但不管如何，根據(jù)「大廠青年」公眾號最新爆料，月之暗面有團(tuán)隊，在國慶期間「一直瘋狂趕進(jìn)度」，主要就是為了即將上線一個「很牛的功能」。

爆料進(jìn)一步指出，該功能與模型的深度推理有關(guān)，預(yù)計將于下一個版本上線，會在搜索入口下方增加一個「深入推理」的功能開關(guān)，可以回答簡單搜索無法解決的問題，甚至可以自我反思。

這是 Kimi 的 o1？

接力 OpenAI o1，通用智能新范式的一次轉(zhuǎn)移

在 OpenAI o1 之前，AI 大模型的表現(xiàn)通常局限于「快速應(yīng)答」，也就是通過預(yù)測下一個詞來生成答案。這種方式效率高，但其思維模式單一，缺少對復(fù)雜問題的深入推理和自我反思能力。

圖/ OpenAI

但隨著 OpenAI 推出的 o1 模型，這種局限性開始被突破。o1 的核心變化在于引入了強(qiáng)化學(xué)習(xí)機(jī)制，模型在面對問題做出響應(yīng)之前，會花上更多時間思考問題，來進(jìn)行深度推理和自我糾錯。

這就類似大腦的慢思考——一種被稱為「系統(tǒng) 2」的能力，o1 有了學(xué)習(xí)并完善思維過程的能力，可以嘗試不同的策略，并認(rèn)識到自己的錯誤。這種能力的提升對于 AI 的智能化帶來了顯著的影響。傳統(tǒng)模型通常只會對用戶輸入做簡單的直線型回答，而沒有「思考」過程的多樣性和深度。

例如，在處理復(fù)雜的數(shù)學(xué)題或法律案例時，模型只是依靠大量數(shù)據(jù)的模式匹配進(jìn)行預(yù)測。o1 通過強(qiáng)化學(xué)習(xí)，讓 AI 可以進(jìn)行多步驟推理，類似于人類解決問題時的思維路徑——先提出假設(shè)，逐步驗證推理，并且在過程中不斷自我修正錯誤。

通過這種慢思考模式，AI 不僅能給出更準(zhǔn)確的答案，還能在面對不確定性時進(jìn)行自我反思，在一定程度上避免過去模型常見的「幻覺」。

楊植麟同樣也在天津大學(xué)的演講中指出，AI 只有通過學(xué)習(xí)人類的思考過程，才能得到更好的泛化能力，而且能通過這個過程又產(chǎn)生了更多天然不存在的數(shù)據(jù)，應(yīng)對更多未知的問題。

圖/上海創(chuàng)新新創(chuàng)業(yè)青年 50 人論壇

這對于最終用戶體驗的影響也是巨大的。對于普通用戶而言，推理能力的增強(qiáng)意味著在與 AI 互動時，能夠獲得更具深度、邏輯性更強(qiáng)的回答。

在 ChatGPT 中使用 o1-preview 模型就能明顯感受到，很多時候不再需要將問題簡單分解成多個小問題逐步提問，而是可以直接提出復(fù)雜的問題，AI 可以通過多步驟推理，給出綜合性的解決方案。

更重要的是，自我反思的引入讓 AI 可以像人類一樣在過程中發(fā)現(xiàn)自身的錯誤。

這種自我反思能力不僅能夠大幅減少錯誤率，還提升了用戶對 AI 的信任感。AI 不再是一個機(jī)械的應(yīng)答者，而更像是一個具備「思考」能力的智能助手，可以理解上下文、深刻分析問題，甚至在發(fā)現(xiàn)自身錯誤時及時調(diào)整，從而為用戶提供更高質(zhì)量的答案。

所以不難理解，為什么 Kimi 要做「深入推理」。事實上，國內(nèi)大模型也在向這一趨勢靠攏，在 9 月底舉辦的阿里云棲大會上，一部分大模型公司和研究機(jī)構(gòu)就達(dá)成了一定的共識，即 OpenAI 推出的 o1-preview 代表了通用智能新的進(jìn)化方式的開端。

通用智能圓桌對話，圖/云棲大會

但趨勢歸趨勢，Kimi 對于「深入推理」功能的迫切，還在于國內(nèi)市場面臨的競爭態(tài)勢在發(fā)生變化。

假期趕進(jìn)度，豆包給到Kimi的壓力越來越大

不管新功能是什么，不難看出，頂著國慶假期趕進(jìn)度，在一定程度上說明了 Kimi 團(tuán)隊的的急迫感。而這些壓力，主要還是來自于國內(nèi)其他大模型公司的激烈競爭。

經(jīng)常看 B 站的朋友應(yīng)該都會發(fā)現(xiàn)，之前一直出現(xiàn)在站內(nèi)廣告中的 Kimi，存在感已經(jīng)相當(dāng)薄弱，取而代之則是滿屏的「豆包」。而字節(jié)跳動的豆包，也無疑是目前國內(nèi) AI 智能助手的領(lǐng)頭羊。

公開數(shù)據(jù)顯示，5 月上線以來，豆包連續(xù)數(shù)月一直占據(jù) App Store 免費(fèi)榜的前列位置，6 月更是長達(dá)一個月霸占榜首。即便到 10 月，豆包也仍排在第四。優(yōu)秀的產(chǎn)品體驗以及海量的推廣，豆包可以說在短時間內(nèi)迅速吸引了海量用戶，也占領(lǐng)了市場。

圖/蘋果

a16z 公布的全球 AI 產(chǎn)品前 100 榜單中，豆包同時出現(xiàn)在網(wǎng)頁端和移動端的前 50 名榜單中，顯示了其在全球市場的影響力。而與之對比，Kimi 在此榜單中未見蹤影。

不只是豆包。同為大模型初創(chuàng)公司的 MiniMax 也在迎來爆發(fā)。從 9 月以來，旗下 AI 智能助手——海螺 AI 的數(shù)據(jù)出現(xiàn)爆發(fā)式增長，月訪問量翻了超過 8 倍，月活用戶接近 500 萬。

另一方面，Kimi 過去最為人熟知的優(yōu)勢就是長文本的處理能力，能夠支持大量資料的快速處理。但隨著技術(shù)的迭代，各家大模型的上下文處理能力都發(fā)生了很大的進(jìn)步，谷歌 Gemini、阿里通義、騰訊元寶以及月之暗面 Kimi，都支持了 1000 萬 Token/字的長上下文。

而在此之后，Kimi 最明顯的「優(yōu)勢」不再明顯，同時各家的競爭也開始多元，甚至更側(cè)重于產(chǎn)品功能層面。在這個階段中，Kimi 并沒有讓用戶感知到其他更明顯的優(yōu)勢，也就很難守住 AI 智能助手「當(dāng)紅炸子雞」的市場地位。

在這種背景下，Kimi 面臨的挑戰(zhàn)是顯而易見的。

抗擊巨頭沖擊波，Kimi 需要「深入推理」

Kimi 正在開發(fā)的「深入推理」功能，無疑是一劑強(qiáng)心劑。在激烈的競爭中推出「深入推理」功能，不僅有利于 Kimi 提供能夠與領(lǐng)先者競爭的差異化功能和能力，在競爭激烈的市場中重新站穩(wěn)腳跟。

更重要的是，「深入推理」不僅意味著能夠得到更復(fù)雜問題的答案，還代表著 AI 可以在長時間對話中進(jìn)行深度思考和自我反思，將極大提升用戶在使用 Kimi 過程中的體驗，尤其是面對復(fù)雜任務(wù)的場景中。

這也符合 Kimi 一直以來的用戶畫像——學(xué)生、大學(xué)生、實習(xí)生、打工人，并且用戶更聚焦在學(xué)習(xí)、辦公協(xié)助上。相較之下，不管是豆包還是海螺 AI 其實都有更多角色扮演、情感交流的定位。

圖/ Kimi

而且對于現(xiàn)在 AI 智能助手的用戶來說，簡單的答案生成已經(jīng)不足以滿足他們的需求。越來越多的用戶期望 AI 不僅是簡單地回答問題，而是能夠幫助復(fù)雜的工作任務(wù)和日常的內(nèi)容創(chuàng)作，甚至在推理過程中自我糾錯。

伴隨用戶對 AI 要求的不斷提高，Kimi「深入推理」或許能夠幫助用戶更好地應(yīng)對他們面臨的更多現(xiàn)實問題和更高難度的任務(wù)，創(chuàng)造更強(qiáng)的用戶黏性。與此同時，「深入推理」對團(tuán)隊自身的提振作用可能也不容忽視。

總而言之，Kimi 的「深入推理」功能或許將是一次關(guān)鍵的升級，對于 Kimi 來說也是一劑強(qiáng)心劑，既是在激烈的市場競爭中重新找回屬于自己的競爭優(yōu)勢，也是為通用智能的范式轉(zhuǎn)變奠定基礎(chǔ)。

或許再之后，「深入推理」將不只是一個功能，而是成為 Kimi 背后大模型的底層能力。而在國產(chǎn)大模型以及 AI 智能助手之中，目前來看，Kimi 很可能是最早邁出這一步的廠商。

特別聲明

本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#豆包 #豆包AI #Kimi #Kimi智能助手 #AI

掃碼下載澎湃新聞客戶端

澎湃矩陣

澎湃新聞微博
澎湃新聞公眾號
澎湃新聞抖音號
派生萬物開放平臺
IP SHANGHAI
SIXTH TONE

新聞報料

報料熱線: 021-962866
報料郵箱: news@thepaper.cn

滬ICP備14003370號

滬公網(wǎng)安備31010602000299號

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：31120170006

增值電信業(yè)務(wù)經(jīng)營許可證：滬B2-2017116

? 2014-2025 上海東方報業(yè)有限公司

反饋

▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

豆包們窮追不舍，Kimi要靠“深入推理”抵御AI巨頭沖擊

掃碼下載澎湃新聞客戶端