- +1
機器翻譯正在消除語言障礙,人類專業(yè)翻譯會下崗嗎?
因為人類語言不通,《圣經(jīng)》故事中的“巴別塔”沒能建成,以失敗告終。如何打破人類語言之間的圍墻,讓人類能無障礙溝通,也成為了人類一直希望解決的問題。

得益于統(tǒng)計和深度學(xué)習(xí)技術(shù),讓機器理解語言,進(jìn)而實現(xiàn)不同語言的無縫溝通,正逐漸成為可能。
在今年《MIT科技評論》推出的十大突破技術(shù)中,巴別魚耳塞成功入選。它可以做到雙方交流時,會對所講的話進(jìn)行翻譯,并在智能手機上大聲播放。手持手機的人回應(yīng)后,回答被翻譯,然后在耳塞中播放,該技術(shù)還能實時翻譯,適用于多種語言,使用方便。
工業(yè)界對于機器翻譯已經(jīng)開始摩拳擦掌。近日,微軟宣布自己的機器翻譯系統(tǒng)達(dá)到了人類專業(yè)翻譯的水平。谷歌、百度、Facebook,包括其他一些科技公司也都在布局機器翻譯,并推出了在線翻譯系統(tǒng)。
可見,隨著技術(shù)的發(fā)展,機器翻譯在教育、旅游、社交、跨境交易等領(lǐng)域?qū)⒂懈蟮膽?yīng)用空間。那么,機器翻譯究竟是如何對人類語言進(jìn)行“理解”,進(jìn)而進(jìn)行翻譯輸出的;如果機器翻譯水平越來越高,從事語言翻譯的人是否會因此丟了工作;如果人類之間的語言障礙被清除,那時候的世界又會是什么樣的?
機器翻譯的三大飛躍
微軟技術(shù)院士黃學(xué)東告訴澎湃新聞(www.kxwhcb.com),機器翻譯達(dá)到目前的水平,經(jīng)過了幾十年的發(fā)張,并經(jīng)歷了三次飛躍。
早在1954年,人類就開始嘗試過讓機器能識別人類的語言,但直到上世紀(jì)80年代,才有人摸索出方法。當(dāng)時,IBM做了研究,利用一些規(guī)則方法,句法分析,語意分析等傳統(tǒng)方法讓機器看懂人類語言。但由于當(dāng)時的人工智能發(fā)展處于“凜冬時期”,效果一直不好,翻譯質(zhì)量也一直上不去。
機器翻譯的第一個飛躍也是IBM做出的。IBM的研究人員用了統(tǒng)計的方法來做機器翻譯。那時,語音識別從傳統(tǒng)的人工智能方法專家系統(tǒng)轉(zhuǎn)為統(tǒng)計學(xué)習(xí)的方法,尤以隱馬爾科夫模型為代表。統(tǒng)計學(xué)方法的應(yīng)用讓機器翻譯在上世紀(jì)90年代有了質(zhì)的飛躍。
進(jìn)入21世紀(jì),機器翻譯迎來了自己的第二次飛躍。這次的進(jìn)步主要依靠深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的方法。這種方法也稱為神經(jīng)機器翻譯(Neural Machine Translation),這個技術(shù)先是用到了語音識別中,再推廣到圖像識別和機器翻譯上。
神經(jīng)機器翻譯,簡要的說,就是對源語言的句子進(jìn)行編碼,即轉(zhuǎn)化為計算機可以“理解”的形式,編碼的結(jié)果會形成很多隱含變量,每個隱含變量代表從句首到當(dāng)前詞匯為止的語義信息。然后通過一個解碼的過程,一個詞、一個詞輸出譯文。
到了2018年,由微軟亞洲研究院與雷德蒙研究院研發(fā)的機器翻譯系統(tǒng),解決了NMT方法的一些局限,并借鑒了人類翻譯過程中的一些方式。例如:對偶學(xué)習(xí)(Dual Learning)、推敲網(wǎng)絡(luò)(Deliberation Networks)、一致性規(guī)范(Agreement Regularization)、聯(lián)合訓(xùn)練(Joint Training)等,讓機器翻譯水平得到了大大提升。
從機器翻譯的三次飛躍上不難看出,一家公司構(gòu)建的翻譯系統(tǒng)效果如何,主要取決與兩點:一是算法是否足夠好,二是數(shù)據(jù)是否夠全、夠多。
這樣看,對于微軟、谷歌、百度等大公司來說,他們有足夠優(yōu)秀的人才來搭建神經(jīng)網(wǎng)絡(luò),也有足夠多的搜索數(shù)據(jù)可供自己搭建的網(wǎng)絡(luò)進(jìn)行訓(xùn)練。國內(nèi)的科大訊飛和搜狗公司,由于本身在語音識別上有較長時間的積累,自然語言資料庫上有優(yōu)勢。
人類會被機器替代,機器翻譯能否改變世界?
機器翻譯技術(shù)領(lǐng)域的進(jìn)步,也讓人們看到了消除語言鴻溝,構(gòu)建“巴別塔”的新希望。但這樣的突破也引發(fā)了部分人的擔(dān)憂:人類是否會被機器替代?
關(guān)于這個問題,黃學(xué)東在接受澎湃新聞采訪時稱,舉了一個馬車與汽車的例子。當(dāng)汽車被發(fā)明出來的時候,英國為了保障馬車夫的生存,曾立法規(guī)定汽車行駛速度不能超過馬車。盡管最后馬車還是被淘汰了,但是出了很多司機,產(chǎn)生了新的職業(yè)。
“所以很多事情不用擔(dān)心。其實我們只是把很多枯燥的工作讓計算機做了。就像以前是打字機,現(xiàn)在有計算機,現(xiàn)在計算機寫出來的文章想修改都很方便。30年前你要寫一篇文章,打錯了,得讓秘書用修改液去涂,但現(xiàn)在機器解放了秘書的工作,而他們也沒有消失,只是去做更復(fù)雜,更專業(yè)的工作了。”黃學(xué)東說。
實際上,大多數(shù)的專業(yè)公司不但不擔(dān)心自己的飯碗會被搶走,甚至還非常擁抱技術(shù)帶來的便利。
美國語言公司協(xié)會與歐洲語言行業(yè)協(xié)會首次發(fā)布的“2015語言行業(yè)調(diào)查報告”稱,大多數(shù)公司在調(diào)查機器翻譯帶來的影響的時候,都選擇了“顯著影響”(5分權(quán)重下選擇4或者5),表明機器翻譯技術(shù)已經(jīng)開始發(fā)揮作用。這份報告還指出,在2014年,大量歐洲公司已經(jīng)開始使用機器翻譯,美國公司有21%的項目用到了機器翻譯,為有史以來最高值。機器翻譯系統(tǒng)也越來越普及,50%的歐洲公司和36%的美國公司擁有機器翻譯引擎。
值得注意的是,該報告是基于對歐美主流中小翻譯公司得出的結(jié)果,可見除了日常使用,機器翻譯已經(jīng)在專業(yè)翻譯領(lǐng)域發(fā)揮著越來越大的應(yīng)用。
這樣的市場也讓許多科技公司看到了價值,包括谷歌、微軟、Facebook、百度、科大訊飛、搜狗等公司都已紛紛布局翻譯機。
目前,谷歌已經(jīng)開發(fā)出了耳機Pixel Buds,可以實時翻譯,并存儲有40種語言,使用時就像有名翻譯家在你耳邊說悄悄話。只是,這款耳機還只能和Pixel智能手機聯(lián)用。
微軟也積極布局,除了開發(fā)有自己的小冰系統(tǒng)外,微軟近期還與小米合作,推出了魔芋AI翻譯機。它用了微軟的認(rèn)知服務(wù)技術(shù),就像iPod一樣,有一個雙鍵,可以做遠(yuǎn)場翻譯,支持60種語言的機器翻譯,并整合了智能助理。
國內(nèi)公司對于巨大的消費市場也是虎視眈眈。科大訊飛和搜狗均在去年推出了自己的手持翻譯機。科大訊飛的曉譯翻譯機支持5種語言翻譯,具備離線功能和即時翻譯。搜狗翻譯機支持離線翻譯和拍照識別翻譯。
在機器翻譯技術(shù)的支持下,各家公司布局的翻譯機紛至沓來,可以預(yù)見的是,機器翻譯在教育、旅游、社交、跨境交易等領(lǐng)域有著巨大的應(yīng)用空間。信息技術(shù)的進(jìn)步在不斷的降低人們的溝通成本,當(dāng)機器翻譯進(jìn)步到可以替代專業(yè)翻譯,我們是不是可以拾起《圣經(jīng)》中的想象:一個能讓不同語言的人無縫溝通的世界會在不遠(yuǎn)的將來到來?





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司