- +1
中國(guó)首個(gè)支持30種方言混說語音大模型發(fā)布
中新社福州5月25日消息,AI(人工智能)正在為傳承語言文化注入全新生命力。中國(guó)運(yùn)營(yíng)商發(fā)布首個(gè)支持30種方言混說語音大模型。
25日,在第七屆數(shù)字中國(guó)建設(shè)峰會(huì)上,中國(guó)電信人工智能研究院發(fā)布業(yè)內(nèi)首個(gè)支持30種方言自由混說的語音識(shí)別大模型——星辰超多方言語音識(shí)別大模型,打破單一模型只能識(shí)別特定單一方言的困境,可同時(shí)識(shí)別理解粵語、上海話、四川話、溫州話等30多種方言,是國(guó)內(nèi)支持最多方言的語音識(shí)別大模型。
中國(guó)幅員遼闊,“百里不同俗,十里不同音”。各種方言語法語音特征各不相同,傳統(tǒng)的方言研究依賴于調(diào)查者主觀感知標(biāo)注,人力工程量巨大且難以系統(tǒng)標(biāo)注。而AI能夠更高效、系統(tǒng)地對(duì)方言進(jìn)行整理歸納,對(duì)方言保護(hù)和傳承意義重大。
構(gòu)建高質(zhì)量方言數(shù)據(jù)庫(kù),是方言保護(hù)和研究的基礎(chǔ)。中國(guó)電信人工智能研究院已構(gòu)建超過30種、超30萬小時(shí)的高質(zhì)量方言數(shù)據(jù)庫(kù),方言數(shù)據(jù)庫(kù)在豐富性和高質(zhì)量等層面均居于業(yè)內(nèi)前列。
此外,中國(guó)電信研發(fā)團(tuán)隊(duì)首創(chuàng)“蒸餾+膨脹”聯(lián)合訓(xùn)練算法,解決超大規(guī)模多場(chǎng)景數(shù)據(jù)集和大規(guī)模參數(shù)條件下,預(yù)訓(xùn)練坍縮的問題。
據(jù)悉,星辰語音大模型已廣泛應(yīng)用落地。星辰語音大模型已在福建、江西、廣西、北京、內(nèi)蒙古等地的中國(guó)電信10000智能客服試點(diǎn)應(yīng)用。接入星辰大模型以后,智能客服秒懂30種方言,實(shí)現(xiàn)日均處理約200萬通電話。此外,星辰語音大模型還落地多地市的12345平臺(tái)。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司