外灘大會｜螞蟻集團公布自研金融大模型：算力集群達萬卡規模

澎湃新聞記者邵文

2023-09-08 17:50

來源：澎湃新聞

? 未來2% >

·螞蟻金融大模型基于螞蟻自研基礎大模型，針對金融產業定制，底層算力集群達到萬卡規模。目前，螞蟻金融大模型已在螞蟻集團的財富、保險平臺上全面測試。

螞蟻集團在2023 Inclusion·外灘大會上發布金融大模型。

9月8日，螞蟻集團在上海舉辦的2023 Inclusion·外灘大會上發布金融大模型。澎湃科技（www.kxwhcb.com）了解到，這款大模型基于螞蟻自研基礎大模型，針對金融產業定制，底層算力集群達到萬卡規模。目前，螞蟻金融大模型已在螞蟻集團的財富、保險平臺上全面測試。

螞蟻集團介紹稱，螞蟻基礎大模型平臺具備萬卡異構集群，其中千卡規模訓練利用率（MFU）為40%，集群有效訓練時長（在分布式計算環境中進行機器學習模型訓練的時間）占比90%以上，RLHF（基于人類反饋的強化學習）在同等模型效果下訓練吞吐性能相較于業界方案提升3.59倍，推理性能相較于業界方案提升約2倍。根據SemiAnalysis此前揭秘GPT-4的文章，OpenAI在GPT-4的訓練中使用了約25000個英偉達A100 GPU（圖形處理器），訓練了90到100天，利用率（MFU）約為32%至36%。

“通用大模型無法在專業嚴謹的領域直接商用，特別是金融服務對錯誤的容忍度很低，金融大模型要確保領域知識和專業邏輯的嚴謹性，才能真正落地帶來產業價值。知識力、專業力、語言力以及安全力，保障四大能力是前提條件，也是金融大模型要解的產業真命題。”螞蟻集團副總裁、金融大模型負責人王曉航介紹，基于金融場景中的大量實踐，螞蟻金融大模型形成了“大模型+知識+服務”驅動的架構，這套架構已經在螞蟻內部金融智能化場景上內測。

王曉航表示，螞蟻金融大模型在萬億量級Token的通用語料基礎上，注入千億量級Token（文本中的最小單位，一個單詞或一個標點符號）金融知識，并從300+真實產業場景中提取了共60萬+高質量指令數據，形成了金融專屬任務性能優化的數據資產。

據介紹，8月底，螞蟻金融大模型已通過證券從業資格、保險從業資格、執業醫師資格、執業藥師資格等專業試題測試。

當天，螞蟻集團發布了基于金融大模型能力的兩款產品：智能金融助理“支小寶2.0”，服務金融產業專家的智能業務助手“支小助”。據透露，支小寶2.0版本已在內測，將在完成相關備案工作后上線。

責任編輯：鄭潔

校對：張艷

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

我要舉報

#外灘大會 #螞蟻集團 #金融大模型 #算力集群 #萬卡規模