- +1
百度搜索接入DeepSeek!打不過就加入?其實意在AI搜索

搜索引擎要被DeepSeek革命?
繼華為、OPPO、TCL、吉利、機械革命等各行各業玩家接連接入DeepSeek-R1模型之后,微信、納米AI搜索、QQ瀏覽器、百度搜索、騰訊元寶等即時通訊軟件、搜索引擎、AI工具,也陸續接入了DeepSeek-R1模型。2月16日晚,百度搜索官方表示,為豐富多元化搜索體驗,將全面接入DeepSeek和文心大模型的最新深度搜索功能。

(圖源:微信公眾號截圖)
DeepSeek-R1的到來,打破了國內AI行業原有的局面,不僅大語言模型領域積累較弱的手機、家電、PC、汽車廠商接入該模型,就連已經開發出AI大模型的騰訊、360等互聯網企業,也在為自家的AI工具接入DeepSeek-R1,而且在更強算力規模的支持下, 體驗比DeepSeek官方平臺更勝一籌。
其中尤為引發行業震蕩的是百度搜索,畢竟百度一度被視作中國AI產業的“扛旗者”,早在2013年甚至更早百度就在探索深度學習AI,多年來在AI技術上持續進行戰略押注,號稱在AI上已投資千億。如今百度搜索接入DeepSeek,是“打不過就加入”,還是另有所圖?
探索AI搜索,百度其實早已出發
網站流量分析機構Statcounter統計數據顯示,2015年到2023年,谷歌在搜索引擎領域幾乎處于壟斷地位,份額始終維持在90%以上,但2024年的最后三個月,谷歌的市場份額卻分別為89.34%、89.99%、89.73%。這種趨勢意味著其他搜索引擎,尤其是正在興起的AI搜索工具,已對谷歌造成了不小的壓力。
傳統的搜索引擎在我們查詢信息時,會篩選出相關的網址鏈接,并按照相關性、發布時間等規則排列,但具體內容如何、是否屬于標題黨,還要我們進入網址之后才能得知。

(圖源:百度AI搜索截圖)
小雷經常需要搜索某類產品的銷量數據或者查證一些消息的真實性,可許多媒體在報道時會隱去具體來源,導致小雷需要花費大量時間在眾多鏈接中查找有效信息。搜索引擎的廣告付費排名問題,對于用戶更是堪稱折磨,嚴重影響了我們尋找有效信息的效率。
任何帶有聯網功能的AI應用,廣義上都屬于AI搜索工具。AI搜索工具可以快速從大量信息中篩選出有效信息,總結歸納后直接展現在用戶眼前,而且基本會告知信息來源,還會附上網址鏈接,便于用戶求證和查看完整信息。相較于傳統搜索引擎,AI搜索能夠主動總結查詢信息的重點內容,不再需要用戶一個個點開鏈接查看、對比各方信息,大幅提升了查找信息的效率。
為進一步提升用戶的搜索體驗,AI企業除了投入巨資訓練AI大模型,還在嘗試為AI搜索工具加入更多技能和高質量信息源。如微信新增的AI搜索功能,關聯了公眾號的文章,生成的內容還可以一鍵發送給微信好友或轉發至朋友圈。騰訊元寶同樣加入了該功能,也可以快捷分享至微信好友、朋友圈、QQ好友、QQ空間、企業微信。

(左:微信,右:騰訊元寶;圖源:App截圖)
AI搜索工具無疑對傳統搜索引擎造成了降維打擊,而身為國內搜索領域領頭羊的百度,自然率先感受到了壓力,并選擇積極擁抱AI,于2024年4月26日正式上線了百度AI助手,將搜索、大模型、智能體相互連接,以滿足用戶多樣化的搜索需求。
當前我們使用百度搜索引擎查找某些信息時,便能夠看到百度AI搜索給出的答案,無需再點進網址查看,減少了一個步驟。百度AI搜索也會提供信息來源的網址,方便用戶查看完整內容。

(圖源:百度AI搜索)
然而面對AI搜索,網友們依然分成了三個派別,部分網友支持AI搜索,認為它讓自己的工作、學習、生活更加方便;另一部分網友聲稱AI搜索準確性不佳,可能會出現某些事實性錯誤;最后一部分網友則屬于中立派,使用AI搜索功能的同時,也會去驗證AI搜索生成信息的準確性。
AI搜索好用但并不完美,百度為AI搜索引入文心和DeepSeek的深度搜索功能,目的或許就在于提高生成內容的準確性。
“AI幻覺”才是AI搜索的最大敵人?
作為一名媒體工作者,小雷經常使用AI搜索查找各種數據,遇到AI幻覺的情況不在少數。例如小雷打開了聯網搜索功能并搜索“2024年中國手機銷量數據”時,DeepSeek-R1(騰訊元寶提供的服務)居然告知小雷現在是2023年10月,所以沒有相關的數據。這種情況通常被稱為“AI幻覺”,指AI生成的內容與事實嚴重不符或存在邏輯錯誤。

(圖源:騰訊元寶截圖)
為更直觀展現AI幻覺問題,小雷對目前國內使用人數較多的六個AI大模型做了一個簡單的“草莓測試”,即向AI提問,Strawberry一詞中有多少個字母“r”?相信看到這個問題的小伙伴沒有一個會回答錯誤,但AI給出的答案卻令小雷瞠目結舌。
在小雷測試的騰訊元寶、豆包、百度AI搜索、Kimi、通義千問、納米AI搜索等工具中,只有騰訊元寶的混元大模型和Kimi的k1.5模型回答正確,其他所有大模型全部回答錯誤。最離譜的是豆包生成的答案,雖然指出了Strawberry的第三、第八、第九個字母是“r”,給出的答案卻依然是Strawberry只有兩個字母“r”。

(從左到右依次為:騰訊元寶、豆包、百度AI搜索、Kimi、通義千問、納米AI搜索;圖源:App截圖)
而小雷將納米AI搜索的模型從智腦(360gpt- Pro)切換至DeepSeek-R1后,該模型回答出了正確答案,并指出單詞結尾的兩個“r”會被誤認為只有一個。

(圖源:納米AI搜索截圖)
小雷在多次測試后發現,相較于一個多月前,AI大模型產生AI幻覺的可能性已明顯降低,查詢部分信息時會告知用戶尚無該數據,而非繼續編造數據,但偶爾仍會出現AI幻覺。AI幻覺的存在,讓小雷無法完全相信AI搜索給出的數據,因而經常需要進入網址查看,并搜索其他文章,通過對比確定信息的真實性。
AI企業也在通過各種方案降低產生AI幻覺的概率,例如加入RAG技術(檢索增強生成技術),讓AI大模型與高質量知識庫掛接,在生成內容前先對照知識庫的準確數據。通過架構優化提升AI大模型的長序列處理能力,同樣可以達到減少AI幻覺的作用。
OpenAI工作人員提出了一種過程監督機制,在AI大模型推理問題時,每個正確步驟均給出自我獎勵,優化思維鏈,而非回答正確結果時才給出自我獎勵。
多個大模型生成的內容互相驗證(模型對模型評估),也是降低AI幻覺的有效方法。如納米AI搜索就推出了多模型協作方案,通過文心一言、智腦、豆包三個大模型協作,成功計算出了Strawberry單詞中字母“r”的數量。

(圖源:納米AI搜索截圖)
總而言之,AI幻覺暫時只能通過優化訓練方式、思維鏈、大模型架構等方案減少產生的概率,無法徹底消除。AI幻覺的存在會降低AI搜索生成內容的準確性,在生成內容后,用戶最好進入AI給出的鏈接,確認信息的可靠度。
百度為AI搜索接入DeepSeek,目的或許就是借助R1、V3等模型的能力,通過深度思考,與文心大模型互相驗證,降低產生幻覺的概率。
AI搜索爆發,百度與DeepSeek互相成就
AI搜索大勢漸成,將逐漸取代傳統搜索模式。盡管AI幻覺依舊存在,可能會出現數據虛假的情況,但AI企業正在通過各種方式減少產生AI幻覺的可能。而在諸多方案中,多模型互相驗證無疑是最簡單有效的方法之一。
國內搜索引擎領域的王者百度,將通過DeepSeek和文心的深度思考能力,提高AI搜索生成內容的準確性,360同樣打造出了多模型協作功能,以提高推理能力。有百度、360打頭陣,預計未來會有更多AI搜索工具選擇此方案。

(圖源:百度截圖)
采用MIT協議及類OpenRAIL授權方式開源的DeepSeek,允許第三方自由使用其代碼,且可以修改、復制、分發,在開源大模型中也是開放性最高的一批。憑借出色的推理能力和開源模式,DeepSeek已然成為國內AI企業合作的主要對象。
當初安卓能夠戰勝iOS之外的其他操作系統,開放性正是原因之一。DeepSeek的開源模式或將讓其成為AI領域的谷歌,將R1、V3及未來訓練出的開源模型打造成AI領域的安卓,不僅是家電、手機廠商快速為設備加入AI功能的最佳選擇,還將成為其他AI企業實現模型對模型評估的首選。
即將免費服務、開源大模型的文心一言,引入DeepSeek的深度思考能力之后,能夠提升AI搜索生成內容的質量,從而奠定在搜索領域的地位。百度的影響力也將對DeepSeek起到加持效果,增加用戶體驗DeepSeek-R1模型的機會。AI領域冉冉升起的新星DeepSeek與搜索領域的老牌王者百度,在AI搜索時代將互相成就,向成為與谷歌比肩的全球互聯網巨頭邁進。
不過,正如雷科技創始人羅超所言:AI搜索目前只是“L3級自動駕駛”的感覺,也就是還是需要人“接管”的,因為“幻覺”的存在,AI搜索給出的答案正確與否未知,用戶往往還需要去搜索引擎里面再檢驗一下——有不少網友吐槽被DeepSeek錯誤答案帶到溝里了。
只要AI搜索準確率沒有幾個9(比如99.9999%),傳統搜索引擎就還有存在價值,實際上,在使用傳統搜索引擎中,人的判斷力是至關重要的。人的大腦想要不退化,AI時代也須還是要去做判斷的,不能什么都用AI給的,否則這跟咸魚有什么區別呢?
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司