▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

阿里的“ZeroSearch”讓AI自學(xué)谷歌搜索本身——將訓(xùn)練成本降低 88%

2025-05-10 19:28
來源:澎湃新聞·澎湃號·湃客
字號

阿里巴巴集團的研究人員開發(fā)出一種新方法,該方法有望顯著降低訓(xùn)練 AI 系統(tǒng)以搜索信息的成本和復(fù)雜性,從而完全消除對昂貴的商業(yè)搜索引擎 API 的需求。

這種名為 “ZeroSearch” 的技術(shù),允許大語言模型 ( LLMs ) 通過模擬方法而非在訓(xùn)練過程中與真實搜索引擎進行交互,從而發(fā)展出先進的搜索能力。這一創(chuàng)新不僅能夠為企業(yè)節(jié)省大量 API 開支,同時也能更好地控制 AI 系統(tǒng)學(xué)習(xí)如何檢索信息的過程。

研究人員在本周公布于 arXiv 的論文中寫道: “強化學(xué)習(xí) ( RL ) 訓(xùn)練需要頻繁的 rollout ,可能涉及數(shù)十萬次搜索請求,因此會產(chǎn)生巨額的 API 費用,嚴(yán)重限制了可擴展性。為了解決這些問題,我們引入了 ZeroSearch ,這是一種強化學(xué)習(xí)框架,激發(fā)大語言模型 ( LLMs ) 的搜索能力,而無需與真實搜索引擎進行交互。”

阿里巴巴剛剛在 Hugging Face 上發(fā)布了 ZeroSearch 激發(fā)大語言模型 ( LLMs ) 的搜索能力而無需搜索 pic.twitter.com/QfniJNO3LH

— AK (@_akhaliq)

2025 年 5 月 8 日

如何用 ZeroSearch 訓(xùn)練 AI 在無需搜索引擎的情況下進行搜索

ZeroSearch 解決的問題十分重要。開發(fā)能夠自主搜索信息的 AI 助手的公司面臨兩大挑戰(zhàn):其一是訓(xùn)練過程中由搜索引擎返回的文檔質(zhì)量不可預(yù)測,其二是調(diào)用數(shù)十萬個諸如 Google 等商業(yè)搜索引擎 API 所需的費用過高。

阿里巴巴的方法始于一種輕量級的監(jiān)督式微調(diào)過程,該過程將大語言模型 ( LLMs ) 轉(zhuǎn)化為一個檢索模塊,使其能夠根據(jù)查詢生成既相關(guān)又不相關(guān)的文檔。在強化學(xué)習(xí)訓(xùn)練過程中,該系統(tǒng)采用了一種研究人員稱之為 “基于課程的 rollout 策略” 的方法,逐步降低生成文檔的質(zhì)量。

研究人員解釋道:“我們的核心洞見在于,大語言模型 ( LLMs ) 在大規(guī)模預(yù)訓(xùn)練過程中已獲得了廣泛的世界知識,并能夠根據(jù)搜索查詢生成相關(guān)的文檔。真實搜索引擎與模擬用的 LLMs 之間的主要區(qū)別在于返回內(nèi)容的文本風(fēng)格。”

以極低成本超越 Google

在對七個問答數(shù)據(jù)集進行的全面實驗中,ZeroSearch 不僅與使用真實搜索引擎訓(xùn)練的模型相當(dāng),甚至常常超過其性能。值得注意的是,一個擁有 7B 參數(shù)的檢索模塊達(dá)到了與 Google 搜索相當(dāng)?shù)男阅埽粋€擁有 14B 參數(shù)的模塊甚至超越了 Google 搜索。

成本節(jié)約非常顯著。根據(jù)研究人員的分析,使用 SerpAPI 通過 Google 搜索進行大約 64,000 次搜索查詢的訓(xùn)練費用約為 586.70 美元,而在四塊 A100 GPU 上使用一個 14B 參數(shù)的模擬大語言模型 ( LLMs ) 訓(xùn)練只需要 70.80 美元,成本降低了 88%。

論文指出:“這證明了在強化學(xué)習(xí)設(shè)置中,使用訓(xùn)練良好的大語言模型 ( LLMs ) 替代真實搜索引擎的可行性。”

這一成果對 AI 開發(fā)的未來意味著什么

這一突破標(biāo)志著訓(xùn)練 AI 系統(tǒng)方法的重大轉(zhuǎn)變。ZeroSearch 表明,AI 可以在不依賴外部工具(如搜索引擎)的情況下不斷進步。

這一影響對于 AI 行業(yè)可能是巨大的。迄今為止,訓(xùn)練先進的 AI 系統(tǒng)通常需要調(diào)用受大型科技公司控制的昂貴 API 服務(wù)。而 ZeroSearch 改變了這一局面,讓 AI 通過模擬搜索而非使用真實搜索引擎來實現(xiàn)搜索功能。

對于預(yù)算有限的小型 AI 公司和初創(chuàng)企業(yè)來說,這一方法可能會使競爭環(huán)境更為公平。高昂的 API 調(diào)用費用一直是開發(fā)高階 AI 助手的主要門檻。通過將這些成本削減近 90%,ZeroSearch 使得先進的 AI 訓(xùn)練更加普及。

除了節(jié)約成本,此技術(shù)還使開發(fā)者能夠更好地控制訓(xùn)練過程。當(dāng)使用真實搜索引擎時,返回文檔的質(zhì)量往往難以預(yù)測。而通過模擬搜索,開發(fā)者可以精確地掌控在訓(xùn)練過程中 AI 接收到的信息。

這一技術(shù)適用于多個模型系列,包括 Qwen-2.5 和 LLaMA-3.2,無論是基礎(chǔ)模型還是經(jīng)過指令調(diào)優(yōu)的變體。研究人員已在 GitHub 和 Hugging Face 上公開了他們的代碼、數(shù)據(jù)集和預(yù)訓(xùn)練模型,使其他研究人員和公司能夠?qū)崿F(xiàn)這一方法。

隨著大語言模型 ( LLMs ) 的不斷演進,像 ZeroSearch 這樣的技術(shù)預(yù)示著未來:AI 系統(tǒng)可以通過自我模擬來發(fā)展出越來越復(fù)雜的能力,而不再依賴外部服務(wù) —— 這有可能改變 AI 開發(fā)的經(jīng)濟模式,并減少對大型科技平臺的依賴。

具有諷刺意味的是,通過教會 AI 在不使用搜索引擎的情況下進行搜索,阿里巴巴可能已經(jīng)創(chuàng)造出一種技術(shù),使得傳統(tǒng)搜索引擎在 AI 開發(fā)中的作用變得不再那么必要。隨著這些系統(tǒng)變得越來越自給自足,技術(shù)領(lǐng)域在短短幾年內(nèi)可能會呈現(xiàn)出截然不同的局面。

    本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋
            主站蜘蛛池模板: 桃园县| 大理市| 乡宁县| 青冈县| 临西县| 淳化县| 治县。| 满城县| 海安县| 噶尔县| 大丰市| 永寿县| 错那县| 临安市| 文昌市| 延庆县| 望江县| 多伦县| 平果县| 含山县| 常德市| 和平县| 开江县| 军事| 察哈| 广饶县| 盐边县| 青川县| 阿克苏市| 崇信县| 泰宁县| 原平市| 阿克| 稷山县| 苏尼特左旗| 阳山县| 新绛县| 黄平县| 两当县| 静海县| 彝良县|