- +1
GPT-4.1上線,和你的工作有什么關(guān)系

5月15日,OpenAI最新版本的非推理大語言模型GPT-4.1正式上線,首先向付費(fèi)用戶開放。接下來,OpenAI還將推出GPT-4.1 mini,它將取代GPT-4o mini成為所有ChatGPT用戶(包括免費(fèi)用戶)的默認(rèn)版本。
GPT-4.1與之前的版本相比,兼顧了高性能和低成本。OpenAI表示,4.1擅長編寫代碼和遵循指示,它的速度更快,在日常的代碼需求上可以很好地替代o3和o4 mini。
值得注意的是,GPT-4.1是專注于為企業(yè)應(yīng)用提供的模型,它的出現(xiàn)也標(biāo)志著,我們已經(jīng)可以將先進(jìn)的AI技術(shù)應(yīng)用于企業(yè)實(shí)踐。
這不僅是大模型行業(yè)的發(fā)展趨勢(shì),也是所有行業(yè)即將被改變的起點(diǎn)。

文/承天蒙
/01/
以企業(yè)為中心的模型
GPT-4.1從一開始就以企業(yè)級(jí)實(shí)用性為設(shè)計(jì)目標(biāo),優(yōu)先考慮開發(fā)者的使用需求。
GPT-4.1的API版本中,上下文容量擴(kuò)展到100萬個(gè)token。這允許API用戶將大規(guī)模的法律和財(cái)務(wù)文檔、或是整個(gè)代碼庫直接輸入模型,從而讓AI協(xié)助審查和分析。
OpenAI表示,在輸入量極大的情況下,大模型性能會(huì)有所下降。但目前的企業(yè)測(cè)試看來,即使在輸入量高達(dá)10萬個(gè)token的情況下,GPT-4.1的性能表現(xiàn)依然穩(wěn)定。
在SWE-bench Verified軟件工程基準(zhǔn)測(cè)試中,GPT-4.1比GPT-4o的評(píng)分提高了21.4分;在Scale的MultiChallenge基準(zhǔn)測(cè)試中,指令執(zhí)行任務(wù)的得分提高了10.5分。與其他模型相比,它還將冗長程度降低了50%,在早期測(cè)試中受到了企業(yè)用戶的稱贊。
ChatGPT目前沒有像API版一樣提供擴(kuò)展的上下文窗口,但OpenAI暗示未來會(huì)提供支持。

/02/
幻覺更低、更便宜
GPT-4.1是在GPT-4.5的基礎(chǔ)上升級(jí)而來。
2025年2月,GPT-4.5首次亮相,就強(qiáng)調(diào)了表現(xiàn)更好的無監(jiān)督學(xué)習(xí)、更豐富的知識(shí)庫和更少的幻覺,幻覺比例從GPT-4o的61.8%下降到37.1%,并展示了更加細(xì)膩的情感差別和長篇寫作方面的改進(jìn)。
盡管取得了這些進(jìn)步,GPT-4.5仍因其高昂的價(jià)格飽受批評(píng),其通過API輸出每百萬個(gè)token的價(jià)格高達(dá)180美元,另外,與o系列相比,它在數(shù)學(xué)和編碼的基準(zhǔn)測(cè)試中也表現(xiàn)不佳。
在此基礎(chǔ)上,GPT-4.1希望成為一種速度更快,更專注的替代方案。雖然它缺乏GPT-4.5的知識(shí)廣度和擴(kuò)展情感模型,但它更適合輔助用戶的編碼,并能更可靠地執(zhí)行用戶指令。在API中,GPT-4.1目前的價(jià)格每百萬個(gè)輸入token為2美元,每百萬個(gè)緩存token為0.5美元,每百萬個(gè)輸出token為8美元。
對(duì)于尋求更低成本,愿意犧牲一點(diǎn)速度和智能的用戶來說,OpenAI也提出了更經(jīng)濟(jì)的選擇。GPT-4.1 mini的價(jià)格為每百萬個(gè)輸入token 0.4美元,每百萬個(gè)緩存token 0.1美元,每百萬個(gè)輸出token 1.6美元。
谷歌的Flash-Lite和Flash模型起價(jià)每百萬個(gè)輸入token為0.075-0.1美元,每百萬個(gè)輸出令牌0.3-0.4美元,不到GPT-4.1基礎(chǔ)價(jià)格的十分之一。GPT-4.1價(jià)格較高,但它的軟件工程基準(zhǔn)測(cè)試分?jǐn)?shù)更高,指令執(zhí)行更精確,更適合注重可靠性的企業(yè)級(jí)用戶。

/03/
更專注于實(shí)用性的發(fā)展趨勢(shì)
GPT-4.5是大模型領(lǐng)域的一個(gè)規(guī)模化里程碑,而 GPT-4.1 則專注于實(shí)用性。它并非成本最高,也并非多模態(tài)性最強(qiáng),但它在企業(yè)關(guān)注的領(lǐng)域——準(zhǔn)確性、部署效率和成本上取得了顯著的提升。
這種重新定位反映了AI領(lǐng)域的行業(yè)趨勢(shì),不再不惜一切代價(jià)構(gòu)建最大的模型,而是致力于讓性能強(qiáng)大的模型更便宜、更容易獲取。GPT-4.1就是秉持著這樣的理念,為那些想將AI更深入地應(yīng)用于工作的企業(yè)團(tuán)體提供了一個(gè)靈活、可立即投入生產(chǎn)的工具。
隨著OpenAI不斷改進(jìn)其模型產(chǎn)品,GPT-4.1在讓先進(jìn)的AI技術(shù)應(yīng)用于企業(yè)生產(chǎn)上邁出了重要的一步。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司