- +1
對話張鈸:中國大模型的“死與生”
原創(chuàng) 甲小姐 王博 王藝 甲子光年

“在中國,光搞大模型很難活下去,必須與應(yīng)用相結(jié)合?!?/p>
作者|甲小姐 王博 王藝
“這些地方必須能有與首要用途結(jié)合的可能性——否則它們就會萎縮,甚至死亡?!?/p>
這是1961年,簡·雅各布斯在《美國大城市的死與生》一書中對紐約、芝加哥等大城市中部分區(qū)域的判斷。
20世紀(jì)50年代,美國城市化發(fā)展路徑面臨轉(zhuǎn)型,城市化從追求人口集中、城市數(shù)量增加和城市規(guī)模擴(kuò)大的傳統(tǒng)模式,向改善城市生活質(zhì)量、增強(qiáng)區(qū)域功能作用的新發(fā)展模式轉(zhuǎn)型。
而七十年后的今天,這種轉(zhuǎn)型發(fā)生在了人工智能領(lǐng)域。
ChatGPT的成功,讓不少大模型從業(yè)者把Scaling Law(規(guī)模法則)奉為圭臬,但是當(dāng)模型參數(shù)到達(dá)一定量級,高質(zhì)量數(shù)據(jù)不足似乎已經(jīng)開始讓模型性能增長速度有所放緩。而應(yīng)用落地、商業(yè)化的壓力,也讓很多在資源方面沒有“無限開火權(quán)”的中國大模型企業(yè)開始面臨到底是“把資源用在模型訓(xùn)練還是落地業(yè)務(wù)”的艱難抉擇。
盡管行業(yè)內(nèi)已形成共識——人工智能是未來,但也有很多認(rèn)知沒有收斂。這一年,我跟行業(yè)內(nèi)的很多人聊過,他們有:燒錢的、賺錢的,投機(jī)的、務(wù)實(shí)的,在場的、出局的。他們的觀點(diǎn)各異,但有一點(diǎn)相同:大談AGI(通用人工智能)的少了,追求ROI(投入產(chǎn)出比)的多了。
如今,市場寒風(fēng)漸起,中國大模型站在了死與生的邊緣。
當(dāng)一切變得艱難而復(fù)雜,我們更需要回到中國人工智能的原點(diǎn),去尋找出發(fā)的理由。唯有溯源,才能撥開重重迷霧,看清前行的路。
我想到一位前輩。
這位前輩叫張鈸,福建福清人,是中國科學(xué)院院士、清華大學(xué)計(jì)算機(jī)系教授、中國人工智能領(lǐng)域奠基人之一。
他本人的故事頗具傳奇色彩。生于1935年的張鈸在43歲的時(shí)候從零開始學(xué)習(xí)人工智能,短短五年內(nèi)就在國際人工智能聯(lián)合會議(IJCAI)上發(fā)表了論文,成為了國內(nèi)最早在國際頂級人工智能會議上發(fā)表論文的幾位作者之一。
后來,他主導(dǎo)成立了國內(nèi)第一個(gè)智能機(jī)器人實(shí)驗(yàn)室,成為了清華大學(xué)計(jì)算機(jī)系計(jì)算機(jī)應(yīng)用方向的第一位博士生導(dǎo)師,建立了國內(nèi)第一個(gè)與人工智能領(lǐng)域有關(guān)的博士點(diǎn),在全球首次提出了“第三代人工智能”的理念。
1953年,張鈸以數(shù)理化全部滿分的成績考入當(dāng)時(shí)最熱門的清華大學(xué)電機(jī)工程系,畢業(yè)之后就留校任教,一直到現(xiàn)在,在清華園已學(xué)習(xí)、工作了七十余年,光是培養(yǎng)的博士生就有93名。黃必清、馬少平、張建偉、朱軍、袁進(jìn)輝……這些在人工智能學(xué)界和業(yè)界的知名人物都是張鈸的學(xué)生。
令人意外的是,雖然已年近九旬,但張鈸依然保持著對人工智能學(xué)界和業(yè)界一線的敏感,對于中國大模型發(fā)展現(xiàn)狀和行業(yè)問題,他毫不客氣地評價(jià):“在中國,光搞大模型很難活下去,必須與應(yīng)用相結(jié)合?!?/p>
以他的成就和資歷,他本不必說這些,但張鈸的直率讓人肅然起敬。
雅各布斯在《美國大城市的死與生》中批評道:“有一種東西比公開的丑陋和混亂還要惡劣,那就是戴著一副虛偽面具,假裝秩序井然?!?/p>
在某種程度上,張鈸和雅各布斯有著相似之處,他們都不是那種“假裝秩序井然”的人,同時(shí)他們也在積極為行業(yè)尋找出路。
本文,甲小姐對話張鈸。
1. 談現(xiàn)狀:光搞大模型很難活下去,必須與應(yīng)用相結(jié)合
甲小姐:去年年底,我們說“AI一天,人間一年”。今年上半年,多模態(tài)模型又如雨后春筍一般出現(xiàn)。但是到了今年下半年,我的感受是,國內(nèi)的大模型市場明顯遇冷,國內(nèi)部分大模型企業(yè)傳出暫停預(yù)訓(xùn)練模型,縮減人員,融資和上市也變得艱難。
甲骨文創(chuàng)始人今年說了一句話:“真正前沿模型的入門價(jià)格是1000億美元?!边@基本上是一個(gè)天塹,造成只有美國的巨頭才有資本入局。人工智能的競賽變成了巨頭資本和算力的競賽,變成了由OpenAI提出概念,然后Meta負(fù)責(zé)開源,國內(nèi)專注應(yīng)用的狀態(tài)。
有人擔(dān)憂,中國是不是做不了預(yù)訓(xùn)練模型?我們是不是只能做應(yīng)用市場?您有這樣的擔(dān)憂嗎?
張鈸:肯定有這樣的擔(dān)憂。我們的資本不僅沒有那么大,而且還極度分散,這個(gè)問題是非常嚴(yán)重的。
一些做大模型的人來找我做顧問,我都會跟他說,你必須有足夠的錢,這個(gè)錢不是指幾百萬、幾千萬,至少幾十億元人民幣才能做出來像樣的大模型。
現(xiàn)在中國是百模大戰(zhàn),但其實(shí)很多大模型都很弱。這個(gè)問題我曾經(jīng)反映過,我說必須集中資源,因?yàn)槲覀兊馁Y源本來就少,可惜誰也不能阻止大家都上。
甲小姐:中美的市場差異還是很大的。
張鈸:美國是“有錢人”的市場,中國是“沒錢人”的市場,就是說市場能不能為企業(yè)提供足夠的錢。中國大模型產(chǎn)業(yè)發(fā)展不順利是肯定的,為什么呢?你必須得有市場兜底,不能光靠投資啊,光靠投資人給錢的話你能活多久?
你要向市場要錢,而中國軟件市場是很難要到錢的,因?yàn)橛懈顿M(fèi)習(xí)慣的問題,無論是to B還是to C,中國的市場規(guī)則是誰便宜就用誰的。
現(xiàn)在的環(huán)境,就是迫使中國的大模型企業(yè)必須馬上去賺錢,因?yàn)楣飧愦竽P秃茈y活下去,必須與應(yīng)用相結(jié)合。
中國大模型企業(yè)僅依靠自身資源想進(jìn)一步提高模型能力很難,現(xiàn)在我們主要是想在大學(xué)里做這方面事情。
甲小姐:那硅谷提的1000億美元的入門價(jià)格,這個(gè)數(shù)字您覺得合理嗎?
張鈸:1000億美元是不是夸大我不知道,但肯定需要很大資金,投資人也有信心,他資金投進(jìn)去能收回來。
美國現(xiàn)在的情況與我們不同,美國只有幾家企業(yè)在競爭大模型,大家只要全心全意去提高質(zhì)量,一旦質(zhì)量提高了,你非用它不可,它馬上就可提高價(jià)錢,大家也愿意付費(fèi)。所以美國那幾家頭部的大模型企業(yè)是無需分心的,就是拼命投入——我只要把大模型質(zhì)量做到最好,我就能站住腳。
甲小姐:那會不會就意味著全世界人工智能的未來發(fā)展,將由少數(shù)巨頭來引領(lǐng)?
張鈸:很可能是這樣。
甲小姐:我感受到的,人工智能領(lǐng)域,中國跟美國是兩個(gè)牽引力,美國更像是不斷給錢,讓人工智能解鎖新的能力;中國是要找需求、找商業(yè)閉環(huán)。所以這就會變成能力驅(qū)動跟需求驅(qū)動的兩個(gè)牽引力。我有點(diǎn)擔(dān)心,如果我們這么早就開始追著需求走、追求實(shí)用主義,我們離解鎖智能本質(zhì)的這件事情會越來越遠(yuǎn)。
張鈸:你的擔(dān)心是對的。即使大模型落地之后,我認(rèn)為也只有少數(shù)企業(yè)能活下來,大多數(shù)大模型企業(yè)活不下來,因?yàn)闀簳r(shí)還沒有那么大的市場。
美國的大模型企業(yè)充分認(rèn)識到了這一點(diǎn),所以他們現(xiàn)在并不著急去落地,因?yàn)樗麄冇X得目前落地很困難,只有把大模型做好了以后再落地,才真正能賺錢。
而現(xiàn)在我們提前落地,困難非常大,需要花很多精力去做這件事情。大學(xué)與研究所應(yīng)該把大模型的基礎(chǔ)工作做好,這樣才能避免將來出現(xiàn)大模型應(yīng)用做不好,大模型的基礎(chǔ)也做不好的局面。
甲小姐:那現(xiàn)在對于拿到一部分錢,但錢又沒有國內(nèi)外頭部大廠那么多的中國人工智能企業(yè)來講,可能就要面臨取舍——是應(yīng)該繼續(xù)花錢和資源去訓(xùn)練新模型,還是說把錢和資源用在應(yīng)用落地上?
張鈸:對于一般企業(yè),我都建議他們找出路賺錢。畢竟企業(yè)不是科研單位,你不賺錢的話,多大的理想都沒有用武之地。
甲小姐:不過,錢并不好賺。之前李開復(fù)老師就說過,很多大模型公司競標(biāo),價(jià)格越競越低,競到最后做一單賠一單,沒有利潤。我感覺,國內(nèi)大模型現(xiàn)在是追到了一定程度,但性能還不是很好,同時(shí)又著急商業(yè)化。C端商業(yè)化不好做,然后就開始做B端,開始提解決方案。
張鈸:對,性能不大好,還硬要別人用。你必須讓客戶得到大的利潤,客戶才愿意出大錢。你現(xiàn)在是不痛不癢地給客戶來用,人家愿意出錢嗎?現(xiàn)在基本情況是,燒的錢比賺的錢大得多,這是最艱難的時(shí)刻,要想辦法找到關(guān)鍵的應(yīng)用,讓自己活下去,才能度過這個(gè)困難期。
甲小姐:有您認(rèn)為做得比較好的企業(yè)嗎?
張鈸:現(xiàn)在有些企業(yè)做法我還是比較贊成的,比如王小川的百川智能,它主要做醫(yī)療健康的大模型,從企業(yè)的角度來看,它有可能活下來,它在努力解決中國的醫(yī)療問題。所以現(xiàn)在國內(nèi)大模型,你只能從應(yīng)用的角度去看。
甲小姐:國內(nèi)大模型市場可能很快就會冷下來,從去年的百模大戰(zhàn),到今年的逐漸遇冷。
張鈸:在國內(nèi)的確有可能會冷一些,但不會完全是泡沫。
我曾經(jīng)講過,一般的應(yīng)用誰都會做,而且技術(shù)門檻并不高,缺乏競爭力。有競爭力的是什么呢?因?yàn)榇竽P湍壳斑€存在一些缺陷,在許多場合直接應(yīng)用有困難,必須讓它跟其它的技術(shù)和工具結(jié)合起來,發(fā)展出來新的應(yīng)用,這樣企業(yè)才能活下來,這就需要創(chuàng)新。
甲小姐:所以出路還是有的?
張鈸:出路是有的,只是需要探索。有一次,一位領(lǐng)導(dǎo)問我如今的大模型怎么樣,我說這一次(人工智能)是真的,以前都有點(diǎn)假(夸大)。(笑)
甲小姐:我感覺大模型確實(shí)解鎖了一些新的能力,但也有一些缺點(diǎn),但是這些新的能力如果不走向一個(gè)非常漂亮的產(chǎn)品,或者鎖定一個(gè)非常具體的應(yīng)用場景,就很難形成商業(yè)收入。那么,中國大模型企業(yè)的出路,您有什么建議?
張鈸:我認(rèn)為有四條路。
第一條路是AI對齊,逐步改善大模型的能力,減少它的錯(cuò)誤。
第二條路是多模態(tài),以圖像生成為例,很多企業(yè)在做文生圖,但其實(shí)文生圖的應(yīng)用不如圖生文,圖生文什么意思?你給一張圖像,模型給出這張圖像的內(nèi)容(文本),相當(dāng)于對圖像的理解,其實(shí),圖生文的產(chǎn)業(yè)應(yīng)用要比文生圖多。
第三條路是智能體,智能體不僅會思考,還能感知和采取行動,這樣不僅會擴(kuò)大它的應(yīng)用場景,而且可以通過感知反饋促使智能體自我改進(jìn)與進(jìn)化。
第四條路是具身智能,就是讓大模型進(jìn)入物理世界。
2. 談模型:OpenAI的大模型發(fā)展并沒有放緩
甲小姐:美國那邊的技術(shù)發(fā)展情況似乎也不太盡如人意,比如OpenAI今年發(fā)了o1模型,但它一直沒有發(fā)布GPT-5。這導(dǎo)致業(yè)界產(chǎn)生疑惑,沿著大語言模型這條路是會有突破性的進(jìn)展,還是可能會遇到一些問題?您是怎么理解的?
張鈸:對于OpenAI的技術(shù)發(fā)展,我還沒有看到減緩的跡象。從GPT-2一直到GPT-3.5、GPT-4o,靠的是什么?靠的是數(shù)據(jù)的增加,靠的是Scaling Law。而從GPT-4到o1,數(shù)據(jù)并沒有變化,但二者的性能有很大的提高,這預(yù)示著一個(gè)新的重大飛躍。
o1證明,數(shù)據(jù)的數(shù)量即使不變,模型的性能還會有重大的改變。這給大家又指了一條出路。我目前盡管只能試用o1-preview,但是preview版本的有些能力已經(jīng)讓我覺得很震撼了。
甲小姐:您覺得o1最驚艷的是什么?
張鈸:最驚艷的是,它的推理能力增強(qiáng)了很多。一些比較復(fù)雜的邏輯推理和常識推理,都可以正確做到。
甲小姐:o1背后體現(xiàn)了什么能力?
張鈸:所謂的“思維鏈”(CoT)技術(shù),它由3個(gè)能力組成。
第一個(gè)是規(guī)劃能力。通過強(qiáng)化學(xué)習(xí),學(xué)會把一個(gè)復(fù)雜的任務(wù)分解、細(xì)化成幾個(gè)簡單的子任務(wù)。
第二個(gè)是運(yùn)用不同策略的能力,也就是說某條路走不通了,會找另外一條路。
最后一個(gè)最重要的,是它會發(fā)現(xiàn)自己的錯(cuò)誤,并具備糾正自己的錯(cuò)誤的能力。通過反復(fù)的思考和檢查自己的錯(cuò)誤,不斷地把思考的結(jié)果(輸出)變成輸入,進(jìn)行再思考,性能因此得到不斷地改善,這是一個(gè)非常了不起的能力。
甲小姐:OpenAI o1和GPT的路線從根源上就分開了嗎?
張鈸:沒有,o1是在GPT-4基礎(chǔ)上做的。主要是加上了思維鏈,即經(jīng)過深思熟慮之后再回答你的問題,每次它都會告訴用戶,究竟花了幾秒或者幾十秒才得到答案。這種能力主要從強(qiáng)化學(xué)習(xí)中得來的。
甲小姐:從這個(gè)跡象來看,您覺得OpenAI的大模型的發(fā)展在2024年并沒有放緩?
張鈸:沒有放緩。因?yàn)镺penAI既不給你看大模型內(nèi)部的構(gòu)造,也不告訴你里面的推理(思考)過程。
甲小姐:那大模型發(fā)展的下一個(gè)里程碑事件會是什么呢?
張鈸:在推理方面還可以逐步提高,大模型可以不斷地學(xué)各種各樣的推理方法,所以它將來會回答越來越難的問題,比如數(shù)學(xué)難題,甚至科學(xué)難題。
再下一步可以發(fā)展多智能體,讓不同的大模型相互進(jìn)行博弈,這就像下圍棋(AlphaGo)一樣,會自我進(jìn)化,自我迭代。因此ASI (Artificial Superintelligence,人工超級智能)也可以期待了。
甲小姐:多智能體是業(yè)界關(guān)于未來的共識,還是在大模型幾個(gè)發(fā)展方向中,您比較看好的那一個(gè)?
張鈸:這是我看好的一個(gè)方向。AlphaGo能自己跟自己博弈,那大模型為什么不可以自己跟自己博弈?
還有一件正在探索的事情,就是說讓機(jī)器主動去做事,這件事當(dāng)然很難,但如果能實(shí)現(xiàn)的話,那機(jī)器超越人類就不存在問題了。
因?yàn)楝F(xiàn)在所有機(jī)器做事都是外部驅(qū)動,所有指令都是人類外部賦予的。一旦它內(nèi)部能自己賦予自己指令,那就跟人類完全一樣。所以現(xiàn)在大家也在研究如何賦予機(jī)器好奇心,因?yàn)槿祟愖畛醯倪M(jìn)步來自于好奇心驅(qū)使下的學(xué)習(xí)。
3. 談行業(yè):做人工智能必須正確理解三件事
甲小姐:您是改革開放后,清華大學(xué)最早一批去美國進(jìn)修的教師,對中國和美國的人工智能發(fā)展都很了解,造成目前中美大模型發(fā)展差異的原因是什么?
張鈸:我們過去很長一段時(shí)間里,實(shí)際上不是特別強(qiáng)調(diào)去做長遠(yuǎn)研究,這方面,我認(rèn)為中國的比美國要落后很多,比如缺乏創(chuàng)新性。在人工智能基礎(chǔ)研究領(lǐng)域,中國基本上是跟著人家做。
以清華為例,目前我們在具體的模型、算法與技術(shù)突破上有一定的能力。比如在視頻生成模型方面,國產(chǎn)視頻生成模型Vidu的核心技術(shù)U-ViT架構(gòu)是由我的學(xué)生朱軍帶領(lǐng)的團(tuán)隊(duì)于2022年9月提出,早于Sora采用的DiT架構(gòu),是全球首個(gè)Diffusion與Transformer融合的架構(gòu),完全由團(tuán)隊(duì)自主研發(fā)。
但是在重大技術(shù)突破上,比如Transformer、語義的向量表示等方面,國內(nèi)的研究團(tuán)隊(duì)主要處于跟蹤狀態(tài)。
甲小姐:“清華系”是中國人工智能非常重要的一股力量,您的很多學(xué)生現(xiàn)在也是行業(yè)里的中流砥柱。在您的學(xué)生中,您比較看好誰的創(chuàng)業(yè)項(xiàng)目?
張鈸:我比較看好之一是我的學(xué)生袁進(jìn)輝創(chuàng)建的硅基流動公司,他們在做人工智能的基礎(chǔ)設(shè)施,因?yàn)檫@件事情很重要。
我們總說中美算力有差距,算力我們當(dāng)然要去追趕,但這不是一時(shí)半會的事。但是,如果我們把算法效率(如大模型的推理速度)提高10倍,那么只要用1/10的算力,就會帶來同樣的效果,這方面中國能夠比美國做得更好,硅基流動就是代表。
很多人會問,為什么在提高算法效率上中國人會做得更好?我覺得,對中國企業(yè)來講,算法效率是生命攸關(guān)的,我們必須全力以赴。也許因?yàn)槊绹擞袕?qiáng)大的算力,算法效率對他們來說只是錦上添花而已。
甲小姐:自從ChatGPT出現(xiàn)以來,“GPU+Transformer+暴力美學(xué)”就成了巨頭們紛紛去做的主導(dǎo)范式,但是我也聽到了一些不同的聲音,比如說這個(gè)東西不是“鐵王座”,未來會有別的東西去代替Transformer。在您看來,Transformer是一個(gè)“鐵王座”嗎?
張鈸:沒有任何一個(gè)東西永遠(yuǎn)都是好的,將來都會有新的東西代替它,整個(gè)技術(shù)的發(fā)展邏輯是這樣的。
但是我覺得在相當(dāng)長一段時(shí)間,我們還是會用Transformer,因?yàn)樗饕ㄟ^注意力機(jī)制解決長距離的關(guān)聯(lián)問題。
要改它,你得想出另外的招,我相信有另外的招,因?yàn)橐粋€(gè)問題不可能只有一種解法。作為學(xué)校來講可以去研究Transformer之外的架構(gòu),但是企業(yè)做這個(gè)事,我覺得風(fēng)險(xiǎn)比較大。
甲小姐:企業(yè)沒有辦法去像一個(gè)孤膽英雄一樣地去做范式突破?
張鈸:企業(yè)的最終目標(biāo)是賺錢,所以企業(yè)必須和學(xué)校不一樣。
甲小姐:您所了解到的這些企業(yè)中,有誰在找錢、賺錢這件事情上做得還不錯(cuò)嗎?
張鈸:有些企業(yè)做得還不錯(cuò),但也存在互相抱團(tuán)的現(xiàn)象,我拿錢投資你,你拿錢投資我。我覺得需要投資上下游,同質(zhì)企業(yè)之間投來投去,如果做不出來的話,風(fēng)險(xiǎn)就很大。
甲小姐:那他們?yōu)槭裁催€要這樣互相投來投去呢?
張鈸:我的理解是分散風(fēng)險(xiǎn)嘛,等于說大家一起想辦法,不然的話競爭太激烈了,大家互相有關(guān)系的話,可以合作起來做一些事,有一定的道理。
甲小姐:接下來您比較期待的人工智能行業(yè)發(fā)生什么?
張鈸:智能體與多智能體之間的交互。
甲小姐:您認(rèn)為中國人工智能從業(yè)者最需要想明白什么問題?
張鈸:在中國做人工智能必須正確理解三件事:
第一,什么是人工智能,人工智能究竟是干什么的?
第二,人工智能現(xiàn)在發(fā)展到什么程度,我們應(yīng)該怎么估計(jì)它?
第三,人工智能究竟會往什么方向發(fā)展?
這三件事必須理解正確,才能夠做正確的事情。
4.談初心:人工智能的未知性充滿吸引力
甲小姐:關(guān)于人工智能,行業(yè)里似乎每個(gè)人都能講出一大堆觀點(diǎn),您是國內(nèi)最早一批研究人工智能的學(xué)者,您認(rèn)為,人工智能是在研究什么?
張鈸:人工智能實(shí)際上是在探索一條機(jī)器智能化的道路,至今我們只見過(人類)碳基智能,有沒有其他可以走向智能的道路?最開始大多數(shù)人是懷疑的。
甲小姐:您最開始接觸人工智能是1978年,那時(shí)候您43歲,當(dāng)時(shí)清華大學(xué)電子工程系更名為計(jì)算機(jī)技術(shù)與工程系,系里的老師們要重新選擇計(jì)算機(jī)相關(guān)的研究方向,是什么讓您下定了決心從零開始學(xué)習(xí)人工智能?
張鈸:當(dāng)時(shí)人工智能處于低潮,是名聲最不好的時(shí)候,為什么還要選擇人工智能?我之前是研究自動控制的,自動控制理論與技術(shù)都很成熟,自動控制理論的書里面充滿數(shù)學(xué),很嚴(yán)謹(jǐn),這些都讓我覺得沒什么可以做。而人工智能領(lǐng)域很多問題都說不清楚,充滿了未知性,這反而吸引了我。
甲小姐:人工智能自1956年誕生以來, 一直存在兩個(gè)相互競爭的范式,即符號主義與聯(lián)結(jié)主義。第一代人工智能以符號主義為代表,強(qiáng)調(diào)符號之間的邏輯關(guān)系,第二代人工智能以聯(lián)結(jié)主義為代表,強(qiáng)調(diào)人工神經(jīng)網(wǎng)絡(luò)。您親身經(jīng)歷了這兩代人工智能發(fā)展,如何評價(jià)這兩代人工智能?
張鈸:第一代人工智能模型是知識驅(qū)動,其最大的優(yōu)點(diǎn)是機(jī)器像人類那樣思考,因此該模型是可理解、可解釋的。但其最大的問題是,機(jī)器的所有知識都要靠人類傳授,而當(dāng)時(shí)人類還無法使用自然語言把知識傳授給機(jī)器,也就是說存在機(jī)器知識獲取和表示的困難,這就造成了第一代人工智能在應(yīng)用和產(chǎn)業(yè)化上都沒有取得很好的進(jìn)展。
第二代人工智能就是人工神經(jīng)網(wǎng)絡(luò)。不過,現(xiàn)在很多人認(rèn)為人工神經(jīng)網(wǎng)絡(luò)就是類腦計(jì)算,這是不正確的,實(shí)際上它屬于腦啟發(fā)下的計(jì)算,通常又稱為數(shù)據(jù)驅(qū)動模型。第二代人工智能的模型盡管在數(shù)據(jù)分類、預(yù)測、生成等方面取得巨大的成就,但它存在不安全、不可信、不可控、不可靠、不易推廣等缺點(diǎn),也嚴(yán)重影響了它在很多場合下的應(yīng)用。
這兩代人工智能做的事情都是針對特定領(lǐng)域,利用特定模型,解決特定任務(wù),都屬于專用人工智能或弱人工智能范疇。
總之,上面提到的人工智能發(fā)展的兩個(gè)階段:第一階段知識驅(qū)動的模型,主要用來模仿人的思考;第二階段數(shù)據(jù)驅(qū)動的模型,主要用來模仿人的感知與情感等。因?yàn)樗鼈冎塾谀M人類的智能行為,追求的目標(biāo)是讓機(jī)器的行為與人類行為相似,并不追求工作原理的一致性,因此稱為行為主義學(xué)派。
還有一條人工智能的道路是類腦計(jì)算,強(qiáng)調(diào)模仿人類大腦的工作原理,這種范式被稱為內(nèi)在主義(Internalism)。內(nèi)在主義認(rèn)為,人工智能必須去模仿人類大腦的工作原理,只有工作原理一樣,行為才能完全一致。
行為主義和內(nèi)在主義這兩種范式大家都在探索,沒有對錯(cuò)之分。從目前的實(shí)踐來看,ChatGPT的出現(xiàn)說明行為主義這條道路走得通。內(nèi)在主義的道路是否走得通?目前還難以判斷,它的研究工作進(jìn)展還很少,因?yàn)槲覀儸F(xiàn)在對人類大腦的工作原理了解得很少。
甲小姐:我們過去在看人工智能發(fā)展史的時(shí)候,大家通常的分法是符號主義、聯(lián)結(jié)主義、行為主義,但是您將人工智能分為了行為主義和內(nèi)在主義兩派,這是為什么?
張鈸:我不清楚他們?yōu)槭裁催@樣劃分。我是這樣看符號主義和聯(lián)結(jié)主義的關(guān)系的,符號主義認(rèn)為智能是通過符號操作來實(shí)現(xiàn)的,聯(lián)結(jié)主義也被稱為亞符號主義(Sub-symbolism),它們其實(shí)都是在模仿人類行為——前者主要是模仿人類的思考,是理性行為;后者主要是通過機(jī)器學(xué)習(xí)模仿人類的感知和情感,是感性行為與情感。
我這里把行為主義跟內(nèi)在主義相對應(yīng)。因此目前的人工智能只在做兩件事,一是去模仿人類的行為,一是去模仿大腦的工作原理。除此之外,似乎還沒有別的道路。
“智能”本身是很難定義的,因?yàn)槲覀儗θ祟惖拇竽X了解的太少。但是好多人總是想用“智能”去定義人工智能,這樣一來就“定義”出好多派別來。
甲小姐:2020年,您和朱軍、蘇航一起發(fā)表了評述文章《邁向第三代人工智能》,為什么要提出“第三代人工智能”的理念?
張鈸:就像前面的分析,前兩代人工智能只是從不同的側(cè)面模擬人類的心智,具有各自的片面性,依靠單個(gè)范式很難觸及人類真正的智能(行為)。
為了建立一個(gè)全面反映人類智能行為的人工智能,需要建立魯棒與可解釋的人工智能理論與方法,發(fā)展安全、可信、可靠與可擴(kuò)展的人工智能技術(shù),也就是第三代人工智能。其發(fā)展的思路是,把第一代的知識驅(qū)動和第二代的數(shù)據(jù)驅(qū)動結(jié)合起來,充分利用知識、數(shù)據(jù)、算法和算力四個(gè)要素(資源),構(gòu)造更強(qiáng)大的人工智能。
我們從2016年開始就陸續(xù)提出了相關(guān)觀點(diǎn),后來在2020年整理發(fā)表了出來。
甲小姐:人工智能缺少理論嗎?
張鈸:是的,我們發(fā)展第三代人工智能的重要思想是:必須建立人工智能的理論。至今人工智能包括大模型在內(nèi),沒有存在的理論可以解釋清楚,所以會引起各種各樣的困惑和誤解。由于大模型中出現(xiàn)很多難以解釋的現(xiàn)象,所以引起大家的恐慌。大家擔(dān)心如果機(jī)器持續(xù)發(fā)展下去,會不會出現(xiàn)意識,會不會不受人類控制,甚至主動攻擊人類?目前理論上還難以做出回答,所以發(fā)展理論是非常必要的。
甲小姐:當(dāng)時(shí)你們在構(gòu)想第三代人工智能的時(shí)候,有想到會是以ChatGPT這樣的形態(tài)出現(xiàn)嗎?
張鈸:我們想得不會那么具體,但是這條路我們是提前看到了。
我們當(dāng)時(shí)提出了三空間融合模型的概念。我們已經(jīng)有了符號(語義)空間模擬大腦的思考行為,也有了向量空間模擬大腦的感覺行為。這兩層處理在人類大腦中是無縫融合的,如果我們能構(gòu)造出第三個(gè)空間-語義向量空間,通過這三空間的融合,就能在計(jì)算機(jī)上實(shí)現(xiàn)認(rèn)知與感知行為的無縫處理,人工智能就有可能達(dá)到與人類相似的智能行為,從根本上解決目前人工智能存在的不可解釋和魯棒性差的困難。
過去,文本(語言)是在有語義的符號空間里處理的,語音、圖像等是在缺乏語義的特征向量空間處理,如何將這兩個(gè)空間融合?我們需要建立第三空間。而這個(gè)中間的第三個(gè)連續(xù)準(zhǔn)語義向量空間,就是ChatGPT實(shí)現(xiàn)的空間。

三空間融合模型示意圖,圖片來源:《邁向第三代人工智能》,為方便閱讀,編者加上了中文注釋
甲小姐:您剛才說人工智能必須建立理論,我理解是一個(gè)關(guān)于人工智能的統(tǒng)一理論,目前這個(gè)統(tǒng)一理論有兆頭了嗎?
張鈸:很難,因?yàn)檫@屬于復(fù)雜系統(tǒng)的分析問題,ChatGPT里頭看起來運(yùn)算很簡單,矩陣相乘,非線性也不多。但問題是這些矩陣非常之大,而且經(jīng)過多輪運(yùn)算,運(yùn)算了幾百上千次以后,你根本不知道里面發(fā)生什么樣的變化。
當(dāng)然,我現(xiàn)在沒能力去做這件事,就看將來有沒有年輕人能去做這件事。
甲小姐:誰最有可能搞出來這個(gè)理論?
張鈸:第二個(gè)愛因斯坦,貢獻(xiàn)至少不低于圖靈嘛。
甲小姐:其實(shí)圖靈測試這種行為主義的思想,某種意義上是規(guī)避了理論建設(shè)的。
張鈸:這也沒辦法,在當(dāng)時(shí)那種情況下只能用那樣的辦法解決問題。不然你糾纏在那個(gè)(智能的)定義上頭,人工智能就沒法弄了。如果沒有理論的話,人工智能還能算一個(gè)很嚴(yán)謹(jǐn)?shù)目茖W(xué)?因此這件事終究還是需要做的。
甲小姐:如果實(shí)現(xiàn)AGI是登上珠穆朗瑪峰,您覺得現(xiàn)在我們大概爬了多遠(yuǎn)?
張鈸:這說不清,但我認(rèn)為要實(shí)現(xiàn)AGI必須做到三件事。
第一,完成任何任務(wù)必須跟領(lǐng)域無關(guān),即達(dá)到領(lǐng)域的通用性。目前我們只在語言這個(gè)問題上,可以做到與領(lǐng)域無關(guān),但是人工智能領(lǐng)域還有大量的任務(wù)做不到與領(lǐng)域無關(guān)。比如說計(jì)算機(jī)醫(yī)療診斷系統(tǒng),不能只針對某幾種病,將來必須做到什么病都能看,這才叫通用。
第二,什么任務(wù)都能干。人類能干的事機(jī)器都能干,而且要達(dá)到人類的水平,這還差很遠(yuǎn),目前的ChatGPT還只會說,不會做。
第三,需要建立統(tǒng)一的理論。
總之,人工智能還在路上,人工智能的發(fā)展任重道遠(yuǎn)。
甲小姐:剛才您提到在第三代人工智能中,語義向量化非常重要。其實(shí)這方面也有兩派意見,第一派認(rèn)為語言是智能的主軸,大語言模型就是通往人工智能的最核心的道路。第二派認(rèn)為語言不是主軸,多模態(tài)等才是。您贊同哪個(gè)?
張鈸:我贊同前面一派。維特根斯坦說過一句話:我的語言界限,就是我的世界界限。所以一旦掌握了語言,就掌握了人類的世界,一旦掌握了人類世界,什么事情都可能發(fā)生。我是相信這句話的。
在語言是主軸的前提下,今后計(jì)算機(jī)視覺會暢通無阻。為什么呢?剛才我說過計(jì)算機(jī)視覺很難做,過去模式識別跟計(jì)算機(jī)視覺不是一碼事。美國研究者做了一件事就非常漂亮,他們把圖像跟文本掛起鉤,就是CLIP(編者注:CLIP是由OpenAI在2021年發(fā)布的一種多模態(tài)模型,旨在建立圖像和自然語言之間的關(guān)聯(lián),它通過對比學(xué)習(xí)來預(yù)訓(xùn)練模型,使圖像和文本能夠被映射到同一特征空間中)。
圖像一旦跟文本掛起鉤,機(jī)器就能處理圖像的語義了,因?yàn)槲谋镜恼Z義,機(jī)器能處理,所以所有的模態(tài)只要跟文本掛起鉤就容易處理了。
甲小姐:每個(gè)時(shí)代的技術(shù)自有屬于它的代際使命。2024年底,如果讓您聊一聊在人工智能行業(yè),您感受到的最大的偏見和誤解,以及對未來發(fā)展的看法,您最想表達(dá)什么?
張鈸:盡管現(xiàn)在大模型落地難、賺錢難,但我認(rèn)為中國企業(yè)發(fā)展的希望比研究工作大得多,因?yàn)槭袌鲇蟹浅?陀^的檢驗(yàn)標(biāo)準(zhǔn),在市場面前誰也做不了假,所以凡是做出正確努力的人,就一定會成功。我之所以介入企業(yè),是因?yàn)槿斯ぶ悄芷髽I(yè)的發(fā)展對國家太重要了。
對于中國企業(yè)我還是很有信心的,盡管現(xiàn)在有些競爭,但最終肯定會有人活下來,活下來說明他至少受到市場的承認(rèn)。哪怕說你水平不如行業(yè)頭部企業(yè),但只要在市場上活下來,你就是成功者。
甲小姐:回顧您近90年的人生,跟人工智能打交道的時(shí)間超過了一半,哪個(gè)時(shí)刻是讓您最難忘的?
張鈸:我最難忘的1984年,在歐洲國際人工智能會議(ECAI)上,我和弟弟張鈴獲得了一項(xiàng)歐洲人工智能獎項(xiàng),成為首次獲得該領(lǐng)域國際重要獎項(xiàng)的中國人。那時(shí)候,很多學(xué)者都過來祝賀我,當(dāng)?shù)孛襟w還過來采訪我。而我們剛剛出國的時(shí)候,好多人會覺得中國學(xué)者沒什么水平,因?yàn)槲覀冎按_實(shí)沒寫過論文,有了這次經(jīng)歷,讓我感到非常自豪。
原標(biāo)題:《甲小姐對話張鈸:中國大模型的死與生|甲子光年》
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司