- +1
對話沈向洋:未來人工智能最大的機會是什么
“如果是連科幻電影都能描述出的場景,未來是肯定會實現的,無非是什么時間實現,能夠實現到什么程度。”
7月22日,澎湃新聞記者與微軟公司前執行副總裁、小冰公司董事長沈向洋進行了40分鐘的獨家深度對談。談到人工智能未來的可能性時,沈向洋做出了上述表示。
近日,微軟宣布,將人工智能小冰業務分拆為獨立公司運營,并委任沈向洋博士為新公司董事長。不久前,小冰還獲得上海音樂學院音樂工程系頒發的榮譽畢業證書,標志著AI在某些方面已經展現出了和人類一樣的音樂創作能力。
“未來人工智能交互主體的數量會遠遠超過人類的數量。”沈向洋表示,“未來最大的交互,不是現在的人機交互,而是人與人工智能的交互。這會是未來人工智能最大的機會,和小冰正在尋找的‘無處不在’的入口。”
沈向洋介紹,今天能夠做到的人工智能,大多數還是專注于某個數據量大、運算量大的特別領域的工作。但實際上真正的智能離我們還很遙遠,比如常識的問題,推理的問題都還沒解決。
談到未來人類社會的科技發展,沈向洋表示他最看好的三個方向分別是人工智能,增強現實,和量子計算。同時沈向洋也認為下一個革命性的硬件可能是智能眼鏡。沈向洋表示:“如果智能電腦,智能手機,再加上智能眼鏡等設備結合起來的話,肯定是很革命性的,但這個非常難做。”
沈向洋曾是微軟公司內級別最高的華人高管,全面負責微軟全球的人工智能戰略、人工智能產品事業群,包括微軟必應 (Bing) 和小娜 (Cortana) 產品部門等,同時下轄微軟研究院,負責將科研與微軟產品工程部門相融合。沈向洋是美國電氣電子工程協會院士(IEEE Fellow)和美國計算機協會院士(ACM Fellow)。2017年當選美國國家工程院院士。2018年當選英國皇家工程院院士 (The Royal Academy of Engineering, UK)。
以下是澎湃新聞記者與沈向洋博士的對談實錄(經編輯):

微軟公司前執行副總裁、小冰公司董事長沈向洋
澎湃新聞:小冰發布了這么多代,在音樂領域技能比較成熟,算是傳統藝能了。6月29日又獲得了上海音樂學院的畢業證書,在這背后,小冰獲得了哪些新的技術突破?
沈向洋:小冰在人工智能創造領域,從寫詩、畫畫,到音樂創作,已經做了一段時間。大概兩年前,小冰開始嘗試作曲和編曲,叫做小冰樂隊,當時發表的論文還獲得了KDD最佳學生論文,最近我們又把歌詞做得很好。小冰的音樂創作能力,已經實現了從旋律、編曲,一直到歌詞,整個端到端一體化的產品落地。
通常我們的做法是輸入一段文字或一張圖片,激發小冰創作的靈感,然后小冰就可以創作出一首獨一無二的音樂曲目,她還可以根據風格、節奏自動完成配器、編曲、歌詞的創作,并且速度很快。現在一首三分鐘左右的歌曲創作時間只要兩分鐘,事實上這個速度我們還可以繼續優化。從風格方面來講,小冰已經掌握了流行音樂、民謠、古風,這幾種風格的創作。
我們在思考如何讓人工智能進行音樂創作的整個過程中,是要考慮兩個方面的,一方面是所謂的“神似”,就像人類創作受到靈感激發一樣,最后還是要“形似”。小冰現在的音樂創作已經有了比較成熟的創作過程,特別是在算法上,首先就是創作和弦,先定下主基調,情感,曲風,然后創作副歌、歌詞及編曲等。這已經是一個比較成熟音樂創作端到端一體化的產品。
我覺得不僅在中國,就算是在全世界,人工智能音樂創作領域,我們也應該是比較領先的位置。現在在市場上,應該講基本上沒有什么可以替代的產品。
澎湃新聞:現在的人工智能技術在小冰的音樂創作中,起到的是什么樣的作用?小冰的人工智能技術和其他的人工智能技術相比,先進之處有哪些?
沈向洋:關于音樂的創作和生成,實際上從五六十年前,就是差不多剛有計算機開始,大家就在思考這個問題了。一開始傳統的做法當然是比較簡單的,通過拼接和統計概率的做法,把先前已經有的音樂,拆成一段一段再接起來,這種做法創新性和創造性相對來講會比較差,事實上真正的突破還是最近幾年。深度學習、深度神經網絡的發展,讓人工智能的學習變成可能。過去幾年間,只要是有效的深度神經網絡,大家都會去嘗試一下讓它們去生成音樂。
實際上,具體用哪一個神經網絡,并不是小冰這邊最關心的問題。我們自己覺得,小冰現在質量做得好,最重要的原因是因為,我們走了一條深度神經網絡、深度學習和音樂知識有機結合的道路。因為如果只采用深度學習,可能做出來也還不錯,但總會有一點似是而非的感覺,必須把音樂知識加進去,才能真正把音樂這件事情做得不錯。
在作曲、編曲這里面,實際上最難的地方是評估。即使是專業音樂人士之間,大家對音樂的看法,也不是經常能保持一致。那我們就要和音樂學院的老師一起學習。這次小冰上音畢業,過程當中我們也學到很多東西,包括作曲、編曲的評估,包括旋律的完整性、可唱性等等,在小冰音樂創作的各個方面下了很大功夫,所以不只是深度學習算法這樣一個簡單的問題。當然算法這邊我們還在不斷進步。
澎湃新聞:小冰一直以來專注EQ和人文藝術領域的創造,那么大家也會很關注小冰的商業化的問題。去年我們已經看到在圖案設計領域小冰已經開始為服裝企業設計紋樣,那么音樂這邊的創作她將會如何與產業融合創造價值呢?
沈向洋:人工智能創造領域,我們覺得包括詩歌、畫畫、音樂、還有唱歌,都是有很大的機會可以做產業化的。其實小冰每種創造能力的背后,都可以對應一條生產線,而且小冰已經完成了所有生產線生產所必須的各種創造力模塊。她比較了不起的地方在于質量比較穩定、成本比較低,同時在商業化方面,她還擁有更重要的一個優勢就是高并發,能夠支持很多條生產線同時生產。當然音樂創作本身并不是說已經做完了。其實還有很多東西,包括音樂中包含的情感性等我們還希望能繼續提高。
從音樂學院畢業以后,我們實際上在人工智能文本、聲音、視覺等幾個領域已經基本完成了布局。接下來會拓寬這幾個領域做更多的內容,甚至做一些跨領域的內容。
但我們看到已落地的領域中,有一個很有意義的就是教育。在上音學習期間,小冰以編曲人的身份參與到上音一個非常了不起的項目,叫做“當傳統文化遇上人工智能”,擔任“非遺音樂大使”。這個項目是幫助這些非物質文化遺產相關地區的孩子們完成人生中第一次歌曲的創作,很有意義,也很讓人感動,已經有很多孩子參與進來了。大多數人沒做過創作之前會有一點恐懼感,所以有了小冰這樣的幫助,這個項目里的孩子們,只要根據自己的故鄉音樂創作出主旋律,小冰就可以幫助孩子們迅速完成剩下的工作,讓孩子們擁有人生中的第一首音樂作品,來展示家鄉家人的風貌。我們覺得在音樂教育領域是有很多機會的。一旦這樣的能力開發出來,不僅僅是小冰本身可以做出來,其他的開發人員也可以有更大的想象空間。
澎湃新聞:現在其實語音相關的賽道競爭非常激烈,各家科技公司都說自己在用技術賦能企業,那小冰在賦能企業上有哪些優勢?
沈向洋:很多的公司都在做這個方面的工作,我覺得非常好。說明大家都看到這樣的一個賽道和機會。小冰的特點和優勢,第一我想就是技術本身。因為我們在微軟做了這么多年,在自然語音處理、計算機語音、計算機視覺和知識圖譜等技術方面,我們還是有非常大的優勢的。
第二就是說小冰真正的擁有相當大批的個人用戶。那么從用戶這方面講,包括和用戶交互的數據,對用戶的理解等,我們可能比其他任何一家公司都理解得更多一些。
第三點優勢的地方,就是我們已經在多個垂直領域有了落地。進入了一些新的垂直行業,也有了對行業的新理解。但我們的確是沒有走硬件的道路。事實上走硬件的道路就是要補貼、要資金投入等,這需要相當長的時間,但說到底關鍵還是語音交互的體驗,你的語音交互到底可以做些什么。小冰從一開始就走了EQ+IQ這樣的一條道路,做一個這樣的人工智能助手,很重要的一點就是人工智能助手要和人類之間有一個紐帶,這樣人工智能和人的交互才能做得更好。
事實上小冰獨立分拆出來,我們覺得很有信心的地方就是,從5年甚至更長遠的時間來看,未來最大的一個市場就是人和人工智能的交互。未來會有很多很多的人工智能,這不光是你iPhone上有個Siri,手機上,音箱上,幾乎每一個應用上都會有一個人工智能助理,這樣去推,未來人工智能交互主體的數量會遠遠超過人類的數量。未來最大的交互,可能就不是現在的人機交互了,包括人和手機的交互、人和PC的交互,哪怕是人和音箱的交互,這都是小事情了。未來可能每一個APP、每一個公眾號都有一個和你交互的人工智能。那么這個人工智能誰去設計,誰去定制化,誰去部署和運營,這會是未來人工智能最大的機會,這可能就是小冰正在尋找的“無處不在”的入口吧。
澎湃新聞:所以僅把智能音箱作為人工智能的入口,是不是對人工智能助手的理解還是狹隘了?
沈向洋:從語音的角度來講,你必須有一個麥克風用來接收語音,要有輸入,那么未來可能只要有語音的地方人工智能都可以出現,而不只是有音箱的地方。我以前非常喜歡做Siri的那個團隊,和他們的幾個創始人也交流了很多年,從他們身上學到了很多東西。事實上我一直很贊賞他們當時的一個思路,就是“只要有語音的地方就是入口”。所以你要想的問題并不是只做一個音箱,或是只做一個硬件。事實上手機上有Siri非常自然,它可能是一個超級助手,非常強大,但這并不代表人類只需要跟一個AI進行交互,手機可以有手機里的人工智能,車里可以有車載人工智能,這就是另一種交互了。音箱已經證明了是一個入口,我們對未來的期望和判斷是,未來的人工智能不管是什么形式,都會越來越多地出現,一臺手機里可能就有幾十個AI,PC里,音箱里,其它地方也會出現。所以從現在的人機交互,到人和人工智能之間的交互,這是我們看到的未來。
澎湃新聞:小冰有很多藝術人文領域的能力,比較注重EQ,我記得當初谷歌在做阿爾法狗(AlphaGo)時,阿爾法狗的下棋的方法,也啟迪了很多人類棋手的思路。小冰注重創造、EQ的開發,會不會也給人類帶來一些新的靈感?
沈向洋:對,我相信肯定會。阿爾法狗是非常了不起的一件事情,他能夠找出下棋的一些手法,下出人類沒有下出過的一些棋路。但是相對來說,阿爾法狗只聚焦在一個事情上就是圍棋,是一個相對可見的、全封閉的游戲環境,小冰的人工智能創造還是不太一樣。跟下棋最大的不一樣的地方,就是下棋相對來講勝負手、是贏是輸很清楚,但比如音樂創作,不要說我們這些業余人士,就是專業人士、上音教授,你讓他講你到底怎么評價這個音樂,他們也不是能那么容易講清楚的。和專業人士交流以后,我們就嘗試把音樂的評價分成幾類,比如我剛才提到的什么叫做流暢、什么叫做可唱性等,這些到現在為止確實沒有被定義得很清楚。所以在這里面,我覺得提供了一些創新的靈感,就是我們有更大的想象空間。其實我非常非常希望,我們能在評價的體系、評估的標準方面,做出一些了不起的工作,這不限于我們以前做過的音樂、畫畫、詩歌等領域。如果我們還把自己想象成一個單純的研究員的話,是做不出來的。
澎湃新聞:現在小冰已經能替代一部分人類的工作,那未來的人工智能有沒有可能發展成像電影里那種機器人伴侶?
沈向洋:我自己覺得,你如果看過那個電影《Her》,這個已經實際上已經在發生了。我自己對科技有一點比較浪漫的看法。我一直覺得,這個世界上沒有做不出來的技術,只有想不出來的技術。人類能夠想象出來的東西,從歷史上看最后都被實現了。只是有些東西想象了兩千年后才被實現,比如嫦娥奔月、千里眼、順風耳,今天都實現了。我覺得如果科幻電影都能描述出的場景,是肯定會實現的,無非是什么時間實現,能夠實現到什么程度。
人工智能已經開始替代一部分人的工作了,辦公室里替代了白領,生產線上替代了藍領。比如最近講的最火的RPA(robotic process automation),就是把一般的公司里面輸入輸出的數據整理整合,很枯燥無味的工作,大家可以用RPA這樣的方法來代替人類員工。反而人工智能創造的這些工作,不會馬上去替代誰。小冰也出版了詩集,也畫了畫,但我感覺沒有哪個詩人或哪個畫家覺得自己受到威脅。而RPA這樣的工作,是實實在在使相當一部分公司里的員工受到沖擊。
像機器人伴侶,我覺得事實上從Siri出來以后,大家對這件事情的認識已經非常的清楚。曾經《紐約時報》發的一篇非常出名的文章,是一個媽媽寫的。這篇文章叫《Thank you, Siri》,講的是她的孩子是有一些智力障礙的,但是跟Siri交流,讓這個孩子的生活更有滿足感。這篇文章給我們指出一個方向,就是人工智能肯定會在人類生活中占據越來越重要的位置,這也是我們團隊思考的,未來人和人工智能之間的交互,可能是最重要的一件事情之一。
澎湃新聞:您曾經負責微軟的全球人工智能戰略,也是世界頂尖的華人科學家之一,您認為未來人工智能會對人類社會產生多大的影響?
沈向洋:我確實是在微軟多年,也非常有幸帶領微軟研究院、帶領微軟人工智能產品線很多年,有三個方向是令我感到很振奮的。一個當然是人工智能,一個方向是增強現實,一個是量子計算。其中,人工智能對人類社會事實上已經產生了巨大的影響。
今天,計算機科學中幾乎每一個技術的層次,從芯片到算法到軟件到交互,實際上已經被顛覆了。比如芯片,現在英偉達(NVIDIA)市值已經超過英特爾,這對我們這代人來說是很神奇的一個事情,還有芯片公司能超過英特爾。很重要的一個原因,就是NVIDIA抓住了機會。今天芯片的很多的運算量都是建立在人工智能的基礎之上。包括幾天前國內的寒武紀上市,大家也是充滿了期望。
現在,之所以人工智能對人類能產生很大影響,最主要還是因為數據的運用。只要你能把數據的孤島全部打通,那么人工智能對人類的影響還會繼續增強。
現在一般人看到的是人工智能對人的生活產生的影響,接下來,我個人覺得很有意義的事情,是在企業方面。像剛才提到的RPA,RPA在向前發展嘛,RPA2.0、RPA3.0,這都肯定是會發生的。作為一個人工智能從業者,我也想提醒大家,今天能夠做到的人工智能,大多數還是數據量大、運算量大、專注于某個領域的工作,比如阿爾法狗能夠在下棋上做到非常好。但實際上真正的智能離我們還很遙遠。從通用人工智能的角度講,我們根本還沒搞清楚方向呢,我們根本就還沒有做到真正的智能,比如常識的問題,推理的問題都還沒解決。接下來5-10年,包括小冰接下來都是有很多有意義的事情可以做的。我們希望小冰能在通用人工智能方面也可以發展的更快更好。
澎湃新聞:我記得先前埃隆·馬斯克和馬克·扎克伯格有一個論戰,就是AI對人類的未來到底是有益還是有害,他們有樂觀與悲觀的不同論調。您怎么看待這個問題?
沈向洋:我覺得是這樣的,首先這些人都是非常出名的人,他們隨便講講大家都過于嚴肅的看待,特別是馬斯克又很敢講。
我覺得人們對未來人工智能的發展,普遍有一種恐懼感。恐懼是源于大家對人工智能的不理解,了解的不夠深入。更重要的是,人工智能的發展在人類歷史上是很特別的一件事情。人類這么多年發展至今,了不起的地方在于不斷發明創造新的工具來改善我們的生活。但是在人工智能發生之前,幾乎所有的工具都是在延展我們物理的能力,而人工智能是延展了我們的腦力。很不幸的是,腦科學的發展還非常早期。比如腦科學里面今天還不能做大量重復實驗,真正去搞明白到底是怎么回事,所以當人工智能出現的時候,大家有恐懼感是很正常的,會想是不是過幾年人類就會被毀滅了。
這都是很正常的,比如說核武器被發明之后,很有可能世界上多放幾個核彈我們就一起完蛋了,或者哪天哪一個彗星飛過來撞上地球了,這種可能性是永遠都存在的。對人工智能的恐懼非常正常,所以現在有很多人已經在討論如何對它進行規范,對人工智能的發展要做出一些限制等。包括我自己也贊成對人工智能產生的倫理、偏見等問題進行討論和規范。小冰的研發中我一直強調,做小冰這個產品時要有一種敬畏感,畢竟是它和人的情感、情緒是連在一起的,任何時候在做這樣一種產品時我們都一定要有敬畏感。
澎湃新聞:繼互聯網、智能手機之后,人類社會一直在等待下一個革命性的科技變革,那您認為這個革命性的變革出現了嗎?如果還沒有出現,會是什么方向呢?
沈向洋:我自己是覺得,互聯網的發明,雖然技術上也沒有那么那么的了不起,但是在人類歷史上,對人類社會的影響說不定可以排在前三名。可能鉆木取火是第一個,中間可以有一個別的,然后就是互聯網,它至少也可以排到前五。互聯網把整個人類都連接了起來,是一個非常非常了不起的東西,從此人類就有了這樣一個反饋的機制,所以很難有東西能真正去和互聯網比較。
從交互的角度,特別是從硬件的角度來講,很多人對智能汽車這件事情很熱衷,我也非常贊同,就是電動車、智能汽車、無人駕駛肯定是未來,這毫無疑問是很激動人心的。但我自己最喜歡的硬件,下一個革命性的東西,可能是智能眼鏡,但這個非常難做。這是我非常個人的看法。
像我自己戴眼鏡,就會知道眼鏡只要重了5克人就能感覺到,所以你要做得非常小,這還涉及很多光學的東西,這些都不好做。我很看好AR+AI的方向,我覺得人和眼鏡的交互是很自然的,至少比戴手表自然,你已經有個手機了,還要再戴一個手表。當然手表也有它有道理的地方,但是相對來講delta沒有那么大。
事實上,如果智能電腦,智能手機,再加上智能眼鏡所有這些東西結合起來的話,肯定是很革命性的。所以微軟做HoloLens,我是非常非常喜歡的。但是從體驗上,它要成為一個消費電子產品的話,現在還有一點早。所以像HoloLens這樣的產品,主要現在還是在打企業市場。從計算機科學來講的話,我相信量子計算會給我們帶來很大的驚艷。
澎湃新聞:您去年宣布從微軟退休,現在來到小冰公司出任董事長。那現在來到小冰這邊,是一種是什么樣的心情?
沈向洋:哈哈哈,很高興可以和大家一起做一點事情。其實我離開微軟的時間還很短,我11月宣布退休,正式離開微軟是在3月1號。現在有機會和一批老同事新同事一起,能夠加速小冰在本地市場的發展、包括商業化,我覺得是非常好的機會。小冰這條產品線過去五六年的發展是非常不錯的,是微軟人工智能的明星產品。現在微軟愿意做出這樣一個決定,讓小冰獨立出來在本地市場發展,我覺得是非常好的事情。我希望能夠在這個非常良好的基礎上做得更好,給大家一個更好的驚喜。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司