- +1
阿里通義實(shí)驗(yàn)室黃斐:開源進(jìn)入千問時(shí)代,即將發(fā)布的推理模型會(huì)更好用

阿里通義千問已成全球第一大開源模型系列,將“很快”放出基于最新模型Qwen2.5-Max的推理模型。
2月21日,全球開發(fā)者大會(huì)(GDC)在上海開幕,在阿里云魔搭社區(qū)主辦的論壇上,據(jù)阿里巴巴通義實(shí)驗(yàn)室科學(xué)家黃斐介紹,到目前為止,整個(gè)通義千問(Qwen)系列模型的下載量達(dá)到了1.8億,累計(jì)衍生模型總數(shù)達(dá)到9萬個(gè),衍生模型數(shù)已經(jīng)超越Meta的Llama系列,成為了全球第一大開源模型系列,并在Hugging Face等第三方榜單和用戶反饋上也取得了不錯(cuò)的成績(jī):“所以現(xiàn)在開始,我們就是一個(gè)千問的時(shí)代,而不是之前Llama的時(shí)代了。”
今年1月底,阿里發(fā)布了AI基礎(chǔ)大模型千問旗艦版Qwen2.5-Max,在多項(xiàng)權(quán)威基準(zhǔn)評(píng)測(cè)中處于業(yè)界領(lǐng)先水平。黃斐表示,Qwen2.5-Max的性能已經(jīng)超越了DeepSeek-V3,不過沒有超越作為推理模型的DeepSeek-R1,正如阿里巴巴集團(tuán)CEO吳泳銘此前所透露的那樣,通義千問正在Qwen2.5-Max的基礎(chǔ)上建立推理模型,“很快就會(huì)把這個(gè)模型放出來”。
據(jù)黃斐介紹,Qwen2.5已經(jīng)開放了7個(gè)不同規(guī)模的Dense(稠密)模型,基于傳統(tǒng)的Transformer架構(gòu),從規(guī)模最小的0.5B到最大的72B,不同大小的模型會(huì)有不同的能力和速度,以適配不同場(chǎng)景的需求。同時(shí),在千問系列的迭代中,預(yù)訓(xùn)練數(shù)據(jù)的大小已經(jīng)從Qwen1.5-72B時(shí)的3T迅速增長(zhǎng)到了Qwen2.5-72B的18T,通過規(guī)模化法則(Scaling Law)達(dá)到了很好的效果。
此外,Qwen2.5還包括3個(gè)采用MoE(混合專家模型)架構(gòu)的API(應(yīng)用程序編程接口)模型,在Dense模型的基礎(chǔ)上“加寬加大”以減少訓(xùn)練代價(jià),用戶可以通過API去調(diào)用,包括Turbo、Plus和Max這三個(gè)版本。
除了為用戶提供充分的選擇以外,黃斐還揭露了另一個(gè)讓千問系列如此受歡迎的“秘訣”,即其支持包括中英文、日語、韓語、西歐各國(guó)語言在內(nèi)的超過29種語言:“千問現(xiàn)在在東南亞國(guó)家也用得非常多,在多語言支持上會(huì)比其他模型好很多。”
對(duì)于未來的發(fā)展方向,黃斐談到推理模型、“Smarter Models(更智慧的模型)”和全能模型(Omni Models)。黃斐解釋道,接下來放出的千問推理模型“會(huì)比大家現(xiàn)在能用到的更好一些”,而“更智慧的模型”不僅會(huì)更聰明,還包括了更快的響應(yīng)和更低的成本。全能模型則是指能將多模態(tài)混合的模型,在輸入輸出方面更加自由。
黃斐認(rèn)為,在模型之外,AI Agent(智能體)也是一個(gè)需要重點(diǎn)關(guān)注的領(lǐng)域:“未來的一段時(shí)間內(nèi),AI Agent一定也是一個(gè)比較火熱的話題。它能夠幫助我們解決比較復(fù)雜的任務(wù),尤其是結(jié)合近期推理模型的發(fā)展,我相信最終很多行業(yè)都可以運(yùn)用到這個(gè)模型的能力,去完成現(xiàn)在只能由人完成的任務(wù)。”
據(jù)魔搭社區(qū)技術(shù)負(fù)責(zé)人陳穎達(dá)在該論壇上的介紹,自2022年11月創(chuàng)建以來,目前,魔搭社區(qū)的模型總量已超過4.5萬個(gè),涵蓋LLM、對(duì)話、語音、文生圖、圖生視頻、AI作曲等多個(gè)領(lǐng)域,魔搭社區(qū)已經(jīng)服務(wù)超過1100萬開發(fā)者。
在21日的GDC大會(huì)上,阿里云魔搭社區(qū)首發(fā)階躍星辰最新開源的兩款多模態(tài)模型,包括全球參數(shù)量最大的開源視頻生成模型Step-Video-T2V,以及業(yè)界首款產(chǎn)品級(jí)開源語音交互模型Step-Audio。其中,Step-Video-T2V是基于300億參數(shù)的文本轉(zhuǎn)視頻預(yù)訓(xùn)練模型,能夠生成高達(dá) 204 幀的視頻;Step-Audio則是業(yè)界首個(gè)產(chǎn)品級(jí)開源語音模型,參數(shù)規(guī)模達(dá)1300多億。目前,這兩款模型均可在魔搭社區(qū)下載和體驗(yàn)。
2月20日晚間,阿里巴巴集團(tuán)公布新季度業(yè)績(jī),該季度營(yíng)收2801.5億元,預(yù)估2773.7億元,同比增長(zhǎng)8%。阿里云季度營(yíng)收317.42億元,同比增長(zhǎng)13%,公共云收入持續(xù)兩位數(shù)增長(zhǎng),AI相關(guān)收入連續(xù)六個(gè)季度三位數(shù)增長(zhǎng),調(diào)整后EBITA增長(zhǎng)33%至31.38億元。
阿里巴巴集團(tuán)CEO吳泳銘在財(cái)報(bào)會(huì)上表示,面向未來,阿里巴巴將繼續(xù)專注三大業(yè)務(wù)類型:國(guó)內(nèi)外電商業(yè)務(wù)、AI+云計(jì)算的科技業(yè)務(wù)、互聯(lián)網(wǎng)平臺(tái)產(chǎn)品。未來三年,阿里將圍繞AI這個(gè)戰(zhàn)略核心,在AI基礎(chǔ)設(shè)施、基礎(chǔ)模型平臺(tái)及AI原生應(yīng)用、現(xiàn)有業(yè)務(wù)的AI轉(zhuǎn)型等三方面加大投入。其中,集團(tuán)未來三年在云和AI的基礎(chǔ)設(shè)施投入預(yù)計(jì)將超越過去十年的總和。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司