- +1
外灘大會|螞蟻集團公布自研金融大模型:算力集群達萬卡規模
·螞蟻金融大模型基于螞蟻自研基礎大模型,針對金融產業定制,底層算力集群達到萬卡規模。目前,螞蟻金融大模型已在螞蟻集團的財富、保險平臺上全面測試。

螞蟻集團在2023 Inclusion·外灘大會上發布金融大模型。
9月8日,螞蟻集團在上海舉辦的2023 Inclusion·外灘大會上發布金融大模型。澎湃科技(www.kxwhcb.com)了解到,這款大模型基于螞蟻自研基礎大模型,針對金融產業定制,底層算力集群達到萬卡規模。目前,螞蟻金融大模型已在螞蟻集團的財富、保險平臺上全面測試。
螞蟻集團介紹稱,螞蟻基礎大模型平臺具備萬卡異構集群,其中千卡規模訓練利用率(MFU)為40%,集群有效訓練時長(在分布式計算環境中進行機器學習模型訓練的時間)占比90%以上,RLHF(基于人類反饋的強化學習)在同等模型效果下訓練吞吐性能相較于業界方案提升3.59倍,推理性能相較于業界方案提升約2倍。根據SemiAnalysis此前揭秘GPT-4的文章,OpenAI在GPT-4的訓練中使用了約25000個英偉達A100 GPU(圖形處理器),訓練了90到100天,利用率(MFU)約為32%至36%。
“通用大模型無法在專業嚴謹的領域直接商用,特別是金融服務對錯誤的容忍度很低,金融大模型要確保領域知識和專業邏輯的嚴謹性,才能真正落地帶來產業價值。知識力、專業力、語言力以及安全力,保障四大能力是前提條件,也是金融大模型要解的產業真命題。”螞蟻集團副總裁、金融大模型負責人王曉航介紹,基于金融場景中的大量實踐,螞蟻金融大模型形成了“大模型+知識+服務”驅動的架構,這套架構已經在螞蟻內部金融智能化場景上內測。
王曉航表示,螞蟻金融大模型在萬億量級Token的通用語料基礎上,注入千億量級Token(文本中的最小單位,一個單詞或一個標點符號)金融知識,并從300+真實產業場景中提取了共60萬+高質量指令數據,形成了金融專屬任務性能優化的數據資產。
據介紹,8月底,螞蟻金融大模型已通過證券從業資格、保險從業資格、執業醫師資格、執業藥師資格等專業試題測試。
當天,螞蟻集團發布了基于金融大模型能力的兩款產品:智能金融助理“支小寶2.0”,服務金融產業專家的智能業務助手“支小助”。據透露,支小寶2.0版本已在內測,將在完成相關備案工作后上線。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司