ChatGPT勁敵現身：Claude3能總結15萬單詞，長文理解準確率超99%

澎湃新聞記者張靜喻琰

2024-03-05 18:31

來源：澎湃新聞

? 未來2% >

·Claude 3能總結15萬個單詞，而ChatGPT只能總結大約3000個單詞。用戶可以輸入大量數據集，并要求Claude 3以備忘錄、信件或故事的形式進行總結。

·Claude 3 Opus是Anthropic最強大的新模型，在行業基準測試中的表現優于OpenAI的GPT-4和谷歌的Gemini Ultra大模型。Claude 3 Opus對長文的語境理解準確率超99%。

當地時間3月4日，美國人工智能初創公司Anthropic發布最新大模型Claude 3系列，該系列包含Claude 3 Opus（著作）、Claude 3 Sonnet （十四行詩）、Claude 3 Haiku（俳句）三個版本。其中，Claude 3 Opus是Anthropic最強大的新模型，在行業基準測試中的表現優于OpenAI的GPT-4和谷歌的Gemini Ultra大模型。這家初創企業過去一年融資五筆，總額約73億美元，由OpenAI前高級成員創立，獲得了谷歌和亞馬遜的支持。

200秒看懂Claude 3：一鍵預測世界經濟走勢(04:00)

可總結15萬個單詞，長文語境理解準確率超99%

Anthropic表示，Claude3系列是目前市面上速度最快、性能最好的人工智能模型，在推理、數學、編程、多語言理解和視覺方面樹立了新的行業基準。

其中，Claude 3 Opus是Anthropic最強大的新模型，在行業基準測試中的表現優于OpenAI的GPT-4和谷歌的Gemini Ultra大模型，尤其在大規模多任務語言理解數據集（MMLU）、研究生級別的谷歌驗證問答基準（GPQA）、數學評測集（GSM8K）、編程多語言測試（HumanEval）等方面均超越了GPT-4和Gemini。

Claude 3 模型與同行大模型在行業基準測試中的表現

Anthropic在官網公布了Claude 3模型與其他模型在多項性能基準上的比較數據。數據顯示，在MMLU上，Claude 3 Opus得到86.8%的得分，而GPT-4得到86.4％。一些差距則較大，例如在編程多語言測試上，Claude 3 Opus得到84.9%的得分，而GPT-4得到67％，這或意味著Claude 3 Opus對于新手學編程的更友好。

此外，Claude 3能夠總結高達15萬個單詞，而ChatGPT只能總結大約3000個單詞。用戶可以輸入大量數據集，并要求Claude 3以備忘錄、信件或故事的形式進行總結，這一能力使得Claude 3在處理長文本方面超過ChatGPT。其中，Claude 3 Opus對于長文的語境理解準確率超99%，“在某些情況下甚至能識別出有哪些詞句是人為插入到原始文本中的。”Anthropic在官網提到。

Claude 3 Opus對長文理解的準確度

Claude 3系列中的Haiku能在3秒內讀取arXiv（arXiv是一個收集物理學、數學、計算機科學、生物學論文預印本網站）上一篇數據密集的研究論文，并附帶圖表和圖形。

Claude 3強大的視覺能力

值得一提的是，與前幾代模型相比，這也是Anthropic首次提供多模態支持，允許用戶上傳圖片、文檔、圖表和其他類型的非結構化數據進行分析和回答，但Claude 3不能生成圖像。

不過，Anthropic也在官網最后表示，盡管與之前發布的大模型相比，Claude3在生物知識、網絡知識和自主性等相關指標上有所進步，但它仍處于人工智能安全等級2 (ASL-2)。Claude紅隊評估得出的結論是，目前這些模型帶來災難性風險的可能性非常小，但公司會持續監測未來的模型。

Anthropic拒絕透露訓練Claude 3花了多長時間，也不愿透露花了多少錢。目前，Claude 3 Opus和Claude 3 Sonnet 已在全球159個國家上線，用戶可在 Claude.ai 中使用，Claude 3 Haiku也將很快與公眾見面。

Anthropic總裁丹妮拉·阿莫代（Daniela Amodei）表示，如果客戶需要處理最復雜的認知任務，比如準確處理復雜的財務分析，他們會選擇Claude 3 Opus，盡管價格更高。據路透社報道，Claude 3 Opus對輸入的每100萬token收取15美元。相比之下，OpenAI對其GPT-4 Turbo模型中輸入的每100萬token收費10美元。而Sonnet和Haiku比Claude 3 Opus更便宜。

創始人系OpenAI前高級成員，過往一年融資73億美元

Anthropic是美國的人工智能初創公司，由OpenAI前高級成員丹妮拉·阿莫代和達里奧·阿莫代（Dario Amodei ）兄妹于 2021 年創立，后者曾擔任OpenAI研究副總裁。

Anthropic公司

據外媒報道，Anthropic公司創始人之一達里奧·阿莫代領導的一群研究人員因對OpenAI發展方向產生分歧而離開OpenAI，他們擔心微軟對OpenAI的首次投資會使其走上更加商業化的道路，從而偏離其最初對高級人工智能安全性的關注。

達里奧·阿莫代在領英上的介紹包括他曾擔任Open AI研究副總裁和谷歌高級研究科學家。在OpenAI，達里奧·阿莫代從2016年工作到2020年，負責監督公司GPT-2和GPT-3語言模型的創建。

丹妮拉·阿莫代在創辦Anthropic公司之前曾在Stripe擔任風險經理，負責監管運營、用戶政策和承保。后來成為OpenAI安全與政策副總裁，在確保人工智能技術的安全和道德使用方面發揮了關鍵作用。

Anthropic這家初創該公司將自己的產品定位為比ChatGPT更安全的替代品。過去一年Anthropic完成五筆融資，總額約73億美元。據《金融時報》報道，谷歌在2023年2月向Anthropic投資約3億美元。亞馬遜公司于2023年9月向Anthropic投資40億美元，作為戰略合作伙伴關系的一部分。

亞馬遜公司在一份新聞稿中表示，亞馬遜計劃在其產品和服務中使用Anthropic的人工智能技術，而Anthropic將依賴亞馬遜網絡服務作為其主要的云服務，并協助亞馬遜開發其定制的人工智能芯片。亞馬遜表示，作為交易的一部分，它將獲得這家人工智能初創公司的"少數股權"，但沒有提供更多細節。

責任編輯：宦艷紅

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

我要舉報

#Claude3 #大語言模型 #GPT-4