GPT-4.1上線，和你的工作有什么關(guān)系

2025-06-10 12:57

來源：澎湃新聞·澎湃號(hào)·湃客

5月15日，OpenAI最新版本的非推理大語言模型GPT-4.1正式上線，首先向付費(fèi)用戶開放。接下來，OpenAI還將推出GPT-4.1 mini，它將取代GPT-4o mini成為所有ChatGPT用戶（包括免費(fèi)用戶）的默認(rèn)版本。

GPT-4.1與之前的版本相比，兼顧了高性能和低成本。OpenAI表示，4.1擅長編寫代碼和遵循指示，它的速度更快，在日常的代碼需求上可以很好地替代o3和o4 mini。

值得注意的是，GPT-4.1是專注于為企業(yè)應(yīng)用提供的模型，它的出現(xiàn)也標(biāo)志著，我們已經(jīng)可以將先進(jìn)的AI技術(shù)應(yīng)用于企業(yè)實(shí)踐。

這不僅是大模型行業(yè)的發(fā)展趨勢(shì)，也是所有行業(yè)即將被改變的起點(diǎn)。

文/承天蒙

/01/

以企業(yè)為中心的模型

GPT-4.1從一開始就以企業(yè)級(jí)實(shí)用性為設(shè)計(jì)目標(biāo)，優(yōu)先考慮開發(fā)者的使用需求。

GPT-4.1的API版本中，上下文容量擴(kuò)展到100萬個(gè)token。這允許API用戶將大規(guī)模的法律和財(cái)務(wù)文檔、或是整個(gè)代碼庫直接輸入模型，從而讓AI協(xié)助審查和分析。

OpenAI表示，在輸入量極大的情況下，大模型性能會(huì)有所下降。但目前的企業(yè)測(cè)試看來，即使在輸入量高達(dá)10萬個(gè)token的情況下，GPT-4.1的性能表現(xiàn)依然穩(wěn)定。

在SWE-bench Verified軟件工程基準(zhǔn)測(cè)試中，GPT-4.1比GPT-4o的評(píng)分提高了21.4分；在Scale的MultiChallenge基準(zhǔn)測(cè)試中，指令執(zhí)行任務(wù)的得分提高了10.5分。與其他模型相比，它還將冗長程度降低了50%，在早期測(cè)試中受到了企業(yè)用戶的稱贊。

ChatGPT目前沒有像API版一樣提供擴(kuò)展的上下文窗口，但OpenAI暗示未來會(huì)提供支持。

/02/

幻覺更低、更便宜

GPT-4.1是在GPT-4.5的基礎(chǔ)上升級(jí)而來。

2025年2月，GPT-4.5首次亮相，就強(qiáng)調(diào)了表現(xiàn)更好的無監(jiān)督學(xué)習(xí)、更豐富的知識(shí)庫和更少的幻覺，幻覺比例從GPT-4o的61.8%下降到37.1%，并展示了更加細(xì)膩的情感差別和長篇寫作方面的改進(jìn)。

盡管取得了這些進(jìn)步，GPT-4.5仍因其高昂的價(jià)格飽受批評(píng)，其通過API輸出每百萬個(gè)token的價(jià)格高達(dá)180美元，另外，與o系列相比，它在數(shù)學(xué)和編碼的基準(zhǔn)測(cè)試中也表現(xiàn)不佳。

在此基礎(chǔ)上，GPT-4.1希望成為一種速度更快，更專注的替代方案。雖然它缺乏GPT-4.5的知識(shí)廣度和擴(kuò)展情感模型，但它更適合輔助用戶的編碼，并能更可靠地執(zhí)行用戶指令。在API中，GPT-4.1目前的價(jià)格每百萬個(gè)輸入token為2美元，每百萬個(gè)緩存token為0.5美元，每百萬個(gè)輸出token為8美元。

對(duì)于尋求更低成本，愿意犧牲一點(diǎn)速度和智能的用戶來說，OpenAI也提出了更經(jīng)濟(jì)的選擇。GPT-4.1 mini的價(jià)格為每百萬個(gè)輸入token 0.4美元，每百萬個(gè)緩存token 0.1美元，每百萬個(gè)輸出token 1.6美元。

谷歌的Flash-Lite和Flash模型起價(jià)每百萬個(gè)輸入token為0.075-0.1美元，每百萬個(gè)輸出令牌0.3-0.4美元，不到GPT-4.1基礎(chǔ)價(jià)格的十分之一。GPT-4.1價(jià)格較高，但它的軟件工程基準(zhǔn)測(cè)試分?jǐn)?shù)更高，指令執(zhí)行更精確，更適合注重可靠性的企業(yè)級(jí)用戶。

/03/

更專注于實(shí)用性的發(fā)展趨勢(shì)

GPT-4.5是大模型領(lǐng)域的一個(gè)規(guī)模化里程碑，而 GPT-4.1 則專注于實(shí)用性。它并非成本最高，也并非多模態(tài)性最強(qiáng)，但它在企業(yè)關(guān)注的領(lǐng)域——準(zhǔn)確性、部署效率和成本上取得了顯著的提升。

這種重新定位反映了AI領(lǐng)域的行業(yè)趨勢(shì)，不再不惜一切代價(jià)構(gòu)建最大的模型，而是致力于讓性能強(qiáng)大的模型更便宜、更容易獲取。GPT-4.1就是秉持著這樣的理念，為那些想將AI更深入地應(yīng)用于工作的企業(yè)團(tuán)體提供了一個(gè)靈活、可立即投入生產(chǎn)的工具。

隨著OpenAI不斷改進(jìn)其模型產(chǎn)品，GPT-4.1在讓先進(jìn)的AI技術(shù)應(yīng)用于企業(yè)生產(chǎn)上邁出了重要的一步。

原文鏈接

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。

我要舉報(bào)

#GPT #OpenAI #大模型 #ChatGPT