- +1
IBM發布新的Granite 3.2系列模型,實現按需推理能力
為了在企業人工智能市場中開拓自己的領地,IBM 公司今天推出了新一代 Granite AI 模型系列,包含實驗性推理能力、視覺和預測功能。
與以往每次發布一樣,IBM 以開放源代碼 Apache 2.0 許可證發布這些模型。所有 Granite 模型現已在 Hugging Face 上線,部分模型也可在 IBM watson.ai 及其他平臺上使用。
這個新系列包含旗艦級純文本大語言模型 Granite 3.2 Instruct,有 8B 和 2B 兩個版本。它可以執行總結、問題解決和代碼生成等任務,并且設計為可以遵循指令。這些類型的模型最適合構建 AI 助手和代理。兩個版本都經過訓練,可以使用類似于其他行業標準模型的"思維鏈"推理,但 IBM 工程師特別設計了更小、性能更高的模型。
每個模型的推理能力都可以通過編程方式開啟或關閉。這意味著 IBM 不需要發布單獨的"推理模型",而是創建了一個可以在對話模式和推理模式之間切換的模型。由于推理在部署時需要大量計算資源,在不需要時關閉這一功能可以節省大量能源。
IBM AI 研究副總裁 Sriram Raghavan 表示:"AI 的下一個時代關注效率、集成和實際影響 - 企業無需過度投入計算資源就能實現強大的成果。"
推理模型通過"逐步"思考問題,業內通常稱之為"思維鏈"。自 DeepSeek 的 R1 發布以來,這類模型越來越受歡迎。大多數推理模型會掃描整個推理空間以發現最佳邏輯"路徑",然后生成最終答案。然而,一旦確定某條路徑不可行,就沒有必要繼續探索整個路徑。
IBM 工程師開發了一種新穎的推理擴展技術,通過使用第二個過程獎勵模型添加獎勵系統,降低了推理任務的計算成本。這個獎勵模型會監控大語言模型,并在推理過程中將其引導至具有更高置信度結果的邏輯路徑。結合可以掃描整個邏輯空間的搜索技術,IBM 研究人員表示,與一體化的 R1 相比,他們能夠創建一個更小、更高效的推理模型方案。
SiliconANGLE 姐妹市場研究公司 theCUBE Research 的首席分析師 Dave Vellante 表示:"DeepSeek 的 R1 發布在某種程度上承認了 IBM 更小、高效率的模型策略。IBM 的簡報強化了這一觀點,指出 DeepSeek 早在 2024 年 12 月就使用了專家混合和其他效率方法,但直到最近 R1 受到關注才引起市場注意。我們認為這呼應了 IBM 在訓練效率和專業架構方面的方法。"
IBM 表示,Granite 3.2 8B 經過調優后,在 AIME2024 和 MATH500 等數學推理基準測試中可以與 Claude 3.5 Sonnet 和 OpenAI GPT-4o 等更大的模型相媲美。
新的多模態視覺模型和更小的護欄模型
IBM 還發布了新的多模態 Granite Vision 3.2 2B,具備計算機視覺能力,專門訓練用于幫助企業處理視覺文檔理解。
Granite Vision 可以處理各種視覺理解任務,但最適合處理文檔。雖然大多數視覺語言模型都是為視覺任務設計的,但很少有模型在光學字符或文本識別方面表現出色。IBM 的工程團隊花費了大量時間訓練 Vision 3.2,使其能夠識別布局、字體、圖表和信息圖表的獨特視覺特征。
Granite Guardian 3.2 是 IBM 最新的護欄 AI 模型,旨在檢測和突出顯示提示和響應中的風險。公司表示,它提供了與 3.1 相當的性能,但速度更快,成本更低。
Guardian 3.2 的一個優點是在監控輸入和輸出時提供"口頭置信度"指示。它不是簡單地表示二元的"是"或"否",而是表達"高"或"低"的置信水平。這為開發人員提供了更好的指示,幫助他們判斷是否可以信任或拒絕輸出,給出了一個可以使用的閾值。
除了更新的 8B 版本外,IBM 還發布了兩個新的模型規模。第一個是精簡的 50 億參數版本,保持接近原始版本的性能。第二個是 Granite 3.2 3B-A800M,通過微調專家混合基礎模型創建。它通過一次只激活其 30 億參數中的 8 億參數來運行,以實現低成本高性能。
IBM Granite 系列的最后一個模型包括緊湊型 Granite Timeseries 模型,也稱為 Tiny Time Mixers。最新添加的 Granite-Timeseries-TTM-R2.1 擴展了模型功能,可以進行長達兩年的日常和每周預測。時間序列模型適用于預測金融、經濟、供應鏈需求預測和零售季節性庫存規劃等行業的長期趨勢。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司