碾壓所有對手？谷歌發布輕量化開源大模型，筆記本電腦就可跑

澎湃新聞記者吳遇利

2024-02-22 12:04

來源：澎湃新聞

? 10%公司 >

開源大模型賽道迎來重磅新品。

當地時間2月21日，谷歌宣布正式推出全新的開源大語言模型（LLM）“Gemma”，旨在幫助開發人員和研究人員負責任地構建人工智能。

據介紹，Gemma大模型與谷歌規模最大、能力最強的人工智能模型Gemini共享技術和基礎架構，“受到 Gemini的啟發，Google DeepMind和Google其他團隊合作開發了Gemma，并用拉丁語中意為‘寶石’的gemma為其命名。”

不過相比Gemini，Gemma更加輕量化。同時，Gemma依舊保持免費使用，其模型權重也一并開源，并且允許商用。

谷歌共發布了兩種不同權重規模的模型，分別為Gemma 2B（20億參數）和Gemma 7B（70億參數）。每種規模都有預訓練和指令微調版本，允許所有組織（無論規模大小）負責任地進行商用和分發。

谷歌發布Gemma的同日，風頭正盛的芯片制造商英偉達也宣布，已與谷歌達成合作，確保Gemma模型在其芯片上順利運行。英偉達還表示，旗下聊天機器人軟件Chat With RTX也將馬上支持Gemma。

值得注意的是，谷歌還強調，Gemma能在關鍵基準上越級碾壓更大的模型。更為令人印象深刻的是，谷歌Gemma可以在筆記本電腦上運行。

谷歌方面表示，Gemini是我們當今廣泛使用的最大、功能最強大的AI模型。與其他開放模型相比，Gemma 2B和7B能夠在其范圍內實現同類最佳的性能。Gemma模型能夠直接在開發人員筆記本電腦或臺式計算機上運行，“值得注意的是，Gemma在關鍵基準上超越了更大的模型，同時遵守我們安全和負責任的輸出的嚴格標準。”

在開源模型的同時，谷歌還公布了有關Gemma的性能、數據集組成和建模方法的詳細信息的技術報告。有研究人員在技術報告中發現，Gemma支持的詞匯表大小達到了256K，這意味著它對英語之外的其他語言能夠提供更好、更快的支持。