▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

DeepL發(fā)展史:一家初創(chuàng)公司與機(jī)器翻譯巨頭的抗?fàn)?/h1>
2024-01-25 16:46
來源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

AI翻譯顛覆了我們的溝通方式,也以前所未有的方式打破了語言溝通障礙。預(yù)計(jì)到2026年,該行業(yè)的全球市場規(guī)模將增長至123億美元,而無數(shù)參與者都希望能從中分得一杯羹。

而總部位于德國科隆的DeepL,卻憑借著初創(chuàng)身份與谷歌、微軟等科技巨頭一路競逐,不斷提高著機(jī)器翻譯的行業(yè)標(biāo)準(zhǔn)。

這家年輕企業(yè)的首款產(chǎn)品是在線詞典Linguee,自計(jì)算機(jī)科學(xué)家Jarek Kutylowski兼公司CEO于2017年創(chuàng)立以來始終保持高速發(fā)展。

Kutylowski出生于波蘭,12歲時(shí)移居德國,剛轉(zhuǎn)學(xué)時(shí)甚至一句德語都不會(huì)說。這讓年少的他第一次認(rèn)識(shí)到語言的重要性,以及跨語言交流的巨大難度。

時(shí)間快進(jìn)到2017年,他創(chuàng)立DeepL的初衷,是意識(shí)到神經(jīng)網(wǎng)絡(luò)這項(xiàng)突破性技術(shù)有望以前所未有的方式徹底攻克難題。他表示:“我們猜測機(jī)器翻譯應(yīng)該會(huì)朝著這個(gè)方向發(fā)展,也相信這項(xiàng)技術(shù)將發(fā)揮巨大作用。看準(zhǔn)了這個(gè)機(jī)會(huì),我們鼓起勇氣想要?jiǎng)?chuàng)造一些偉大的成果。”

神經(jīng)機(jī)器翻譯(NMT)就是基于神經(jīng)網(wǎng)絡(luò)的翻譯技術(shù),已經(jīng)成為迄今為止最為成功的機(jī)器翻譯方法。與之前的版本相比,這項(xiàng)技術(shù)更快、更準(zhǔn)確、資源占用更少也更易于擴(kuò)展。

DeepL使用該技術(shù)提供免費(fèi)的高質(zhì)量翻譯服務(wù),且主要面向B2B市場。自公司成立以來,他們已經(jīng)服務(wù)了10億以上的用戶,目前擁有超過2萬家企業(yè)客戶,其中不乏愛思唯爾、富士通和Mastodon等知名公司。

Kutylowski解釋道:“翻譯對(duì)企業(yè)來說至關(guān)重要。現(xiàn)如今,越來越多的企業(yè)開始走向全球以開拓海外市場,希望能在更廣大的疆土上吸引客戶、創(chuàng)造價(jià)值。”

而對(duì)翻譯的主要需求,集中在那些涉及大量許可證的行業(yè),比如法律服務(wù)。“通過觀察,我們發(fā)現(xiàn)這也是客群需求最強(qiáng)烈的領(lǐng)域。”

截至目前,DeepL已經(jīng)支持橫跨歐亞大陸的31種語言。2023年,公司推出AI寫作助手,也成功躋身獨(dú)角獸行列。盡管融資環(huán)境嚴(yán)峻,該公司還是在1月籌集到一筆數(shù)額不明的資金(估計(jì)為1億美元),目前市場估值達(dá)到10億歐元。

“世界上最好的”機(jī)器翻譯服務(wù)

DeepL自信地宣稱,能夠提供“世界上最好的”AI翻譯服務(wù)。而且與競爭對(duì)手的產(chǎn)品相比,該公司的方案質(zhì)量更高,平均準(zhǔn)確率高達(dá)3倍。

自信滿滿的口號(hào)源自“盲測”結(jié)果,即由專業(yè)翻譯人員在不知文本來源的前提下挑選準(zhǔn)確率最高的翻譯結(jié)果。

通過一系列測試和實(shí)驗(yàn),我發(fā)現(xiàn)DeepL的表現(xiàn)確實(shí)名列前茅。我首先輸入了加繆《局外人》小說中的一段話,并分別用DeepL和谷歌翻譯將其從法語翻譯成英語。

盡管文學(xué)類文本并不屬于這些工具的主要設(shè)計(jì)用途,但我還是決定從這個(gè)角度入手,畢竟純文學(xué)對(duì)AI系統(tǒng)來說肯定更有難度。

可以想見,文學(xué)翻譯相當(dāng)復(fù)雜,依靠的不止有對(duì)語言的熟悉程度。其中還涉及更高水平的創(chuàng)造力,對(duì)于作者觀點(diǎn)、文風(fēng)和社會(huì)歷史背景的深刻理解,同時(shí)要能在不同文化間實(shí)現(xiàn)語義轉(zhuǎn)換。

從續(xù)訂來看,DeepL的表現(xiàn)遠(yuǎn)遠(yuǎn)優(yōu)于谷歌。雖然它還是遺漏了一些隱喻性表達(dá),在某些意指和常識(shí)上也犯了錯(cuò)誤,但最終文本讀起來確實(shí)更接近原文的表述。

我用自己的一篇文章進(jìn)行了重復(fù)測試,希望復(fù)查翻譯工具是否確切表達(dá)了我說的意思。這一次,任務(wù)是把英語文章翻譯成希臘語。

下面來看DeepL的翻譯結(jié)果:

再看看谷歌的翻譯結(jié)果:

這次DeepL的表現(xiàn)仍然更好。盡管仍在幾處紕漏,但它的希臘語翻譯結(jié)果更細(xì)致、更自然,也更符合原文的含義。我知道很多朋友可能看不懂希臘語,所以大家可以隨便找點(diǎn)文字自己測試一下,看我說的對(duì)不對(duì)。

Kutylowski認(rèn)為,在不“閹割”的前提下用目標(biāo)語言表達(dá)正確的含義,首先得在準(zhǔn)確性和流暢性之間找到適當(dāng)?shù)钠胶狻6@在很大程度上要視語境而定。比如說,技術(shù)文檔對(duì)于準(zhǔn)確性要求更高,而營銷文本則更多強(qiáng)調(diào)流暢性。

盡管面臨挑戰(zhàn),但他堅(jiān)信AI有能力掌握哪怕最復(fù)雜的語言。他補(bǔ)充道:“如果突然出現(xiàn)某種需要我們學(xué)習(xí)的外星語言,那么只要有足夠的翻譯材料作為支撐,我們沒準(zhǔn)同樣能訓(xùn)練出相應(yīng)的翻譯模型。”

DeepL的優(yōu)勢(shì)是什么?

Kutylowski對(duì)于市場競爭似乎毫不擔(dān)心。他強(qiáng)調(diào),“我們一直都在跟大廠競爭”,還提到谷歌翻譯仍是DeepL目前最大的競爭對(duì)手。

在他看來,這家初創(chuàng)公司的優(yōu)勢(shì)可以歸結(jié)為三大要素的結(jié)合:努力工作、優(yōu)秀團(tuán)隊(duì)還有專心一意。

“專心一意非常非常重要。翻譯并不是谷歌的核心業(yè)務(wù),只能算他們上百種服務(wù)中的一種。同樣的標(biāo)準(zhǔn)放在大語言模型和OpenAI方面也是一樣,翻譯只是他們關(guān)注的一個(gè)方向,他們必須把GPU分散在各種各樣不同的任務(wù)上。但我們只專注單一特定領(lǐng)域。”

從技術(shù)角度來看,DeepL的成功則源自其神經(jīng)網(wǎng)絡(luò)架構(gòu)、人類編輯的輸入還有訓(xùn)練數(shù)據(jù)。

這家初創(chuàng)公司根據(jù)大量數(shù)據(jù)(主要來自互聯(lián)網(wǎng))進(jìn)行模型訓(xùn)練,并使用特殊的網(wǎng)絡(luò)爬蟲來自動(dòng)查找翻譯并評(píng)估內(nèi)容質(zhì)量。他們還使用強(qiáng)化學(xué)習(xí)等方法向AI提供積極反饋,引導(dǎo)其不斷提升翻譯水平。

Kutylowski還補(bǔ)充道,另一個(gè)重點(diǎn)是在模型的翻譯能力和用目標(biāo)語言構(gòu)成句子之間尋找適當(dāng)?shù)钠胶狻!盀榇耍覀冊(cè)趩握Z數(shù)據(jù)模型訓(xùn)練和目標(biāo)翻譯模型訓(xùn)練方面投入了大量精力,數(shù)學(xué)團(tuán)隊(duì)則負(fù)責(zé)處理大量細(xì)節(jié)。”

機(jī)器翻譯:新挑戰(zhàn),也是新機(jī)遇

Kutylowski承認(rèn),近期對(duì)于AI熱潮的廣泛關(guān)注主要源自大語言模型(LLM),這也讓整體環(huán)境變得更具挑戰(zhàn)、節(jié)奏更快。

DeepL團(tuán)隊(duì)現(xiàn)在必須跟上發(fā)展的腳步:新模型層出不窮,開源項(xiàng)目所在多有,學(xué)術(shù)研究和其他公司的成果都需要關(guān)注。

“如今的機(jī)器翻譯已經(jīng)掀起一波競賽”,那要靠怎樣的策略才能在這場比賽中勝出?

在Kutylowski看來,一方面當(dāng)然是不斷創(chuàng)新,確保采取正確的步驟來實(shí)現(xiàn)高質(zhì)量翻譯目標(biāo)。另外就是適當(dāng)投資,確保找到合適的資本和技術(shù)團(tuán)隊(duì)。

但與此同時(shí),人們對(duì)于AI的關(guān)注和呈指數(shù)級(jí)增長的發(fā)展速度也帶來了新的技術(shù)機(jī)遇。“有些事情我們?cè)趦伞⑷昵熬涂紤]過,但當(dāng)時(shí)的技術(shù)還不夠成熟。”

比如說貼合企業(yè)風(fēng)格的個(gè)性化翻譯和更具交互性的翻譯體驗(yàn)。DeepL還開始研究票據(jù)翻譯,并從頭開始訓(xùn)練自己的大語言模型。這在一定程度上要?dú)w功于他們新的超級(jí)計(jì)算機(jī)集群DeepL Mercury。

這些大模型有望進(jìn)一步提高翻譯質(zhì)量,并為用戶帶來新的交互工作流程。更多功能和應(yīng)用選項(xiàng)將在2024年內(nèi)陸續(xù)推出。

我們還需要學(xué)外語嗎?

機(jī)器翻譯既幫助更多人克服了跨語種溝通障礙,同時(shí)也提出了新的問題:既然AI翻譯這么出色,未來我們是不是就沒必要學(xué)習(xí)外語了?

Kutylowski的回答是:“隨著AI的普遍進(jìn)步,我覺得全人類都需要認(rèn)真思考一個(gè)問題:我們需要學(xué)什么,我們想要學(xué)什么?”

他認(rèn)為如果單純是為了在異國他鄉(xiāng)工作和生活,那隨著科技的發(fā)展演進(jìn),學(xué)習(xí)語言的必要性確實(shí)會(huì)逐漸降低,但這并不代表學(xué)習(xí)外語的價(jià)值也將隨之下降。

他以數(shù)學(xué)為例,提到雖然在現(xiàn)實(shí)生活中我們根本用不到在學(xué)校里接觸過的大部分復(fù)雜方程,但學(xué)習(xí)數(shù)學(xué)的過程仍然非常重要,甚至可以說是培養(yǎng)理性思考能力的根基。

語言學(xué)習(xí)也是如此。在學(xué)習(xí)一門語言的過程中,我們實(shí)際也是在學(xué)習(xí)如何形成思維和表達(dá)觀點(diǎn)——這對(duì)每個(gè)人的發(fā)展都至關(guān)重要。學(xué)習(xí)外語、特別是掌握跨語種思維能力,對(duì)于個(gè)人乃至整個(gè)社會(huì)都有著深遠(yuǎn)的積極意義。

研究表明,學(xué)習(xí)第二語言實(shí)際會(huì)改變大腦結(jié)構(gòu)。具體來講,它增加了灰質(zhì)密度(對(duì)應(yīng)大腦中的神經(jīng)元數(shù)量)和白質(zhì)完整性(即連接大腦中不同區(qū)域的神經(jīng)纖維系統(tǒng))。也就是說,學(xué)習(xí)外語不僅可以增強(qiáng)大腦整體功能,還有助于提高記憶力、注意力、集中力和其他關(guān)鍵認(rèn)知能力。

此外,大量研究已經(jīng)把語言學(xué)習(xí)跟良好的考試成績、就業(yè)能力、創(chuàng)造力、溝通技巧乃至跨文化認(rèn)知聯(lián)系了起來。

Kutylowski總結(jié)道:“因此,無論是出于個(gè)人興趣,還是大腦與性格的培養(yǎng)與發(fā)展,都應(yīng)該重視學(xué)習(xí)語言。哪怕手機(jī)上就有最好的翻譯工具,如果要結(jié)交來自不同國家的朋友、發(fā)展一段跨國戀情,至少得能做到直接交流。至少我不希望大家坐在一起,還在各自擺弄手機(jī)。”

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            主站蜘蛛池模板: 鱼台县| 施秉县| 六盘水市| 即墨市| 仪征市| 泰宁县| 隆子县| 玉门市| 军事| 牟定县| 阳原县| 平邑县| 六枝特区| 高青县| 年辖:市辖区| 葵青区| 叶城县| 嘉禾县| 伊宁市| 福海县| 新泰市| 咸阳市| 汝南县| 界首市| 三河市| 扎赉特旗| 蓝田县| 睢宁县| 黔西| 禄丰县| 平遥县| 漠河县| 万全县| 克什克腾旗| 青冈县| 五华县| 克拉玛依市| 昆明市| 鄂托克前旗| 伊金霍洛旗| 集贤县|