- +1
ChatGPT勁敵現身:Claude3能總結15萬單詞,長文理解準確率超99%
·Claude 3能總結15萬個單詞,而ChatGPT只能總結大約3000個單詞。用戶可以輸入大量數據集,并要求Claude 3以備忘錄、信件或故事的形式進行總結。
·Claude 3 Opus是Anthropic最強大的新模型,在行業基準測試中的表現優于OpenAI的GPT-4和谷歌的Gemini Ultra大模型。Claude 3 Opus對長文的語境理解準確率超99%。
當地時間3月4日,美國人工智能初創公司Anthropic發布最新大模型Claude 3系列,該系列包含Claude 3 Opus(著作)、Claude 3 Sonnet (十四行詩)、Claude 3 Haiku(俳句)三個版本。其中,Claude 3 Opus是Anthropic最強大的新模型,在行業基準測試中的表現優于OpenAI的GPT-4和谷歌的Gemini Ultra大模型。這家初創企業過去一年融資五筆,總額約73億美元,由OpenAI前高級成員創立,獲得了谷歌和亞馬遜的支持。
Anthropic表示,Claude3系列是目前市面上速度最快、性能最好的人工智能模型,在推理、數學、編程、多語言理解和視覺方面樹立了新的行業基準。
其中,Claude 3 Opus是Anthropic最強大的新模型,在行業基準測試中的表現優于OpenAI的GPT-4和谷歌的Gemini Ultra大模型,尤其在大規模多任務語言理解數據集(MMLU)、研究生級別的谷歌驗證問答基準(GPQA)、數學評測集(GSM8K)、編程多語言測試(HumanEval)等方面均超越了GPT-4和Gemini。

Claude 3 模型與同行大模型在行業基準測試中的表現
Anthropic在官網公布了Claude 3模型與其他模型在多項性能基準上的比較數據。數據顯示,在MMLU上,Claude 3 Opus得到86.8%的得分,而GPT-4得到86.4%。一些差距則較大,例如在編程多語言測試上,Claude 3 Opus得到84.9%的得分,而GPT-4得到67%,這或意味著Claude 3 Opus對于新手學編程的更友好。
此外,Claude 3能夠總結高達15萬個單詞,而ChatGPT只能總結大約3000個單詞。用戶可以輸入大量數據集,并要求Claude 3以備忘錄、信件或故事的形式進行總結,這一能力使得Claude 3在處理長文本方面超過ChatGPT。其中,Claude 3 Opus對于長文的語境理解準確率超99%,“在某些情況下甚至能識別出有哪些詞句是人為插入到原始文本中的。”Anthropic在官網提到。

Claude 3 Opus對長文理解的準確度
Claude 3系列中的Haiku能在3秒內讀取arXiv(arXiv是一個收集物理學、數學、計算機科學、生物學論文預印本網站)上一篇數據密集的研究論文,并附帶圖表和圖形。

Claude 3強大的視覺能力
值得一提的是,與前幾代模型相比,這也是Anthropic首次提供多模態支持,允許用戶上傳圖片、文檔、圖表和其他類型的非結構化數據進行分析和回答,但Claude 3不能生成圖像。
不過,Anthropic也在官網最后表示,盡管與之前發布的大模型相比,Claude3在生物知識、網絡知識和自主性等相關指標上有所進步,但它仍處于人工智能安全等級2 (ASL-2)。Claude紅隊評估得出的結論是,目前這些模型帶來災難性風險的可能性非常小,但公司會持續監測未來的模型。
Anthropic拒絕透露訓練Claude 3花了多長時間,也不愿透露花了多少錢。目前,Claude 3 Opus和Claude 3 Sonnet 已在全球159個國家上線,用戶可在 Claude.ai 中使用,Claude 3 Haiku也將很快與公眾見面。
Anthropic總裁丹妮拉·阿莫代(Daniela Amodei)表示,如果客戶需要處理最復雜的認知任務,比如準確處理復雜的財務分析,他們會選擇Claude 3 Opus,盡管價格更高。據路透社報道,Claude 3 Opus對輸入的每100萬token收取15美元。相比之下,OpenAI對其GPT-4 Turbo模型中輸入的每100萬token收費10美元。而Sonnet和Haiku比Claude 3 Opus更便宜。
創始人系OpenAI前高級成員,過往一年融資73億美元
Anthropic是美國的人工智能初創公司,由OpenAI前高級成員丹妮拉·阿莫代和達里奧·阿莫代(Dario Amodei )兄妹于 2021 年創立,后者曾擔任OpenAI研究副總裁。

Anthropic公司
據外媒報道,Anthropic公司創始人之一達里奧·阿莫代領導的一群研究人員因對OpenAI發展方向產生分歧而離開OpenAI,他們擔心微軟對OpenAI的首次投資會使其走上更加商業化的道路,從而偏離其最初對高級人工智能安全性的關注。
達里奧·阿莫代在領英上的介紹包括他曾擔任Open AI研究副總裁和谷歌高級研究科學家。在OpenAI,達里奧·阿莫代從2016年工作到2020年,負責監督公司GPT-2和GPT-3語言模型的創建。
丹妮拉·阿莫代在創辦Anthropic公司之前曾在Stripe擔任風險經理,負責監管運營、用戶政策和承保。后來成為OpenAI安全與政策副總裁,在確保人工智能技術的安全和道德使用方面發揮了關鍵作用。
Anthropic這家初創該公司將自己的產品定位為比ChatGPT更安全的替代品。過去一年Anthropic完成五筆融資,總額約73億美元。據《金融時報》報道,谷歌在2023年2月向Anthropic投資約3億美元。亞馬遜公司于2023年9月向Anthropic投資40億美元,作為戰略合作伙伴關系的一部分。
亞馬遜公司在一份新聞稿中表示,亞馬遜計劃在其產品和服務中使用Anthropic的人工智能技術,而Anthropic將依賴亞馬遜網絡服務作為其主要的云服務,并協助亞馬遜開發其定制的人工智能芯片。亞馬遜表示,作為交易的一部分,它將獲得這家人工智能初創公司的"少數股權",但沒有提供更多細節。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司