▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

阿里通義實(shí)驗(yàn)室黃斐:開源進(jìn)入千問時(shí)代,即將發(fā)布的推理模型會(huì)更好用

澎湃新聞?dòng)浾?胡含嫣
2025-02-21 22:43
來源:澎湃新聞
? 10%公司 >
字號(hào)

阿里通義千問已成全球第一大開源模型系列,將“很快”放出基于最新模型Qwen2.5-Max的推理模型。

2月21日,全球開發(fā)者大會(huì)(GDC)在上海開幕,在阿里云魔搭社區(qū)主辦的論壇上,據(jù)阿里巴巴通義實(shí)驗(yàn)室科學(xué)家黃斐介紹,到目前為止,整個(gè)通義千問(Qwen)系列模型的下載量達(dá)到了1.8億,累計(jì)衍生模型總數(shù)達(dá)到9萬個(gè),衍生模型數(shù)已經(jīng)超越Meta的Llama系列,成為了全球第一大開源模型系列,并在Hugging Face等第三方榜單和用戶反饋上也取得了不錯(cuò)的成績(jī):“所以現(xiàn)在開始,我們就是一個(gè)千問的時(shí)代,而不是之前Llama的時(shí)代了。”

今年1月底,阿里發(fā)布了AI基礎(chǔ)大模型千問旗艦版Qwen2.5-Max,在多項(xiàng)權(quán)威基準(zhǔn)評(píng)測(cè)中處于業(yè)界領(lǐng)先水平。黃斐表示,Qwen2.5-Max的性能已經(jīng)超越了DeepSeek-V3,不過沒有超越作為推理模型的DeepSeek-R1,正如阿里巴巴集團(tuán)CEO吳泳銘此前所透露的那樣,通義千問正在Qwen2.5-Max的基礎(chǔ)上建立推理模型,“很快就會(huì)把這個(gè)模型放出來”。

據(jù)黃斐介紹,Qwen2.5已經(jīng)開放了7個(gè)不同規(guī)模的Dense(稠密)模型,基于傳統(tǒng)的Transformer架構(gòu),從規(guī)模最小的0.5B到最大的72B,不同大小的模型會(huì)有不同的能力和速度,以適配不同場(chǎng)景的需求。同時(shí),在千問系列的迭代中,預(yù)訓(xùn)練數(shù)據(jù)的大小已經(jīng)從Qwen1.5-72B時(shí)的3T迅速增長(zhǎng)到了Qwen2.5-72B的18T,通過規(guī)模化法則(Scaling Law)達(dá)到了很好的效果。

此外,Qwen2.5還包括3個(gè)采用MoE(混合專家模型)架構(gòu)的API(應(yīng)用程序編程接口)模型,在Dense模型的基礎(chǔ)上“加寬加大”以減少訓(xùn)練代價(jià),用戶可以通過API去調(diào)用,包括Turbo、Plus和Max這三個(gè)版本。

除了為用戶提供充分的選擇以外,黃斐還揭露了另一個(gè)讓千問系列如此受歡迎的“秘訣”,即其支持包括中英文、日語、韓語、西歐各國(guó)語言在內(nèi)的超過29種語言:“千問現(xiàn)在在東南亞國(guó)家也用得非常多,在多語言支持上會(huì)比其他模型好很多。”

對(duì)于未來的發(fā)展方向,黃斐談到推理模型、“Smarter Models(更智慧的模型)”和全能模型(Omni Models)。黃斐解釋道,接下來放出的千問推理模型“會(huì)比大家現(xiàn)在能用到的更好一些”,而“更智慧的模型”不僅會(huì)更聰明,還包括了更快的響應(yīng)和更低的成本。全能模型則是指能將多模態(tài)混合的模型,在輸入輸出方面更加自由。

黃斐認(rèn)為,在模型之外,AI Agent(智能體)也是一個(gè)需要重點(diǎn)關(guān)注的領(lǐng)域:“未來的一段時(shí)間內(nèi),AI Agent一定也是一個(gè)比較火熱的話題。它能夠幫助我們解決比較復(fù)雜的任務(wù),尤其是結(jié)合近期推理模型的發(fā)展,我相信最終很多行業(yè)都可以運(yùn)用到這個(gè)模型的能力,去完成現(xiàn)在只能由人完成的任務(wù)。”

據(jù)魔搭社區(qū)技術(shù)負(fù)責(zé)人陳穎達(dá)在該論壇上的介紹,自2022年11月創(chuàng)建以來,目前,魔搭社區(qū)的模型總量已超過4.5萬個(gè),涵蓋LLM、對(duì)話、語音、文生圖、圖生視頻、AI作曲等多個(gè)領(lǐng)域,魔搭社區(qū)已經(jīng)服務(wù)超過1100萬開發(fā)者。

在21日的GDC大會(huì)上,阿里云魔搭社區(qū)首發(fā)階躍星辰最新開源的兩款多模態(tài)模型,包括全球參數(shù)量最大的開源視頻生成模型Step-Video-T2V,以及業(yè)界首款產(chǎn)品級(jí)開源語音交互模型Step-Audio。其中,Step-Video-T2V是基于300億參數(shù)的文本轉(zhuǎn)視頻預(yù)訓(xùn)練模型,能夠生成高達(dá) 204 幀的視頻;Step-Audio則是業(yè)界首個(gè)產(chǎn)品級(jí)開源語音模型,參數(shù)規(guī)模達(dá)1300多億。目前,這兩款模型均可在魔搭社區(qū)下載和體驗(yàn)。

2月20日晚間,阿里巴巴集團(tuán)公布新季度業(yè)績(jī),該季度營(yíng)收2801.5億元,預(yù)估2773.7億元,同比增長(zhǎng)8%。阿里云季度營(yíng)收317.42億元,同比增長(zhǎng)13%,公共云收入持續(xù)兩位數(shù)增長(zhǎng),AI相關(guān)收入連續(xù)六個(gè)季度三位數(shù)增長(zhǎng),調(diào)整后EBITA增長(zhǎng)33%至31.38億元。

阿里巴巴集團(tuán)CEO吳泳銘在財(cái)報(bào)會(huì)上表示,面向未來,阿里巴巴將繼續(xù)專注三大業(yè)務(wù)類型:國(guó)內(nèi)外電商業(yè)務(wù)、AI+云計(jì)算的科技業(yè)務(wù)、互聯(lián)網(wǎng)平臺(tái)產(chǎn)品。未來三年,阿里將圍繞AI這個(gè)戰(zhàn)略核心,在AI基礎(chǔ)設(shè)施、基礎(chǔ)模型平臺(tái)及AI原生應(yīng)用、現(xiàn)有業(yè)務(wù)的AI轉(zhuǎn)型等三方面加大投入。其中,集團(tuán)未來三年在云和AI的基礎(chǔ)設(shè)施投入預(yù)計(jì)將超越過去十年的總和。

    責(zé)任編輯:王杰
    圖片編輯:李晶昀
    校對(duì):丁曉
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            主站蜘蛛池模板: 石景山区| 高雄市| 额尔古纳市| 文登市| 东莞市| 望奎县| 桂林市| 正宁县| 龙胜| 铜陵市| 县级市| 广昌县| 东源县| 普格县| 松潘县| 阿克陶县| 阳高县| 芜湖县| 泉州市| 淅川县| 台前县| 柘城县| 温州市| 哈尔滨市| 东城区| 西藏| 大邑县| 苍溪县| 凌云县| 惠来县| 鸡西市| 唐海县| 渭南市| 巴塘县| 南木林县| 威信县| 会东县| 张家港市| 江源县| 罗平县| 双流县|