▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

阿爾法狗“人肉臂”黃士杰:結束圍棋項目,轉戰下個領域

澎湃新聞記者 王心馨
2017-12-13 21:58
來源:澎湃新聞
? 科學湃 >
字號

5月份的烏鎮人機大戰上,當今世界圍棋第一人柯潔在賽后曾這樣評價坐在他對面的對手:“黃博士來擺棋,可能更讓我有和AI對戰的感覺。我也特別佩服黃博士,大家看直播也能看到我很愛動,總喜歡活動身體,而黃博士總是一動不動,不上廁所、不喝水、也不吃東西……所以跟黃博士下棋時,我覺得黃博士就是AlphaGo。”

柯潔(前左)、黃士杰(前右)在烏鎮圍棋峰會現場。有一個細節值得一提,從直播鏡頭里看,當時柯潔旁邊的桌子上,除了一個水杯,還有兩盤水果和零食。而黃士杰這邊的桌子上,只有一個白色水杯。三場比賽都是如此的擺設。

柯潔這里說的黃博士,正是AlphaGo的“人肉臂”黃士杰(Aja Huang),他是DeepMind的高級研究員,AlphaGo團隊的領導成員之一。北京時間12月11日晚間,DeepMind公司在自己官網上線了AlphaGo教學工具,旨在幫助公眾用新的、啟發性的方式下圍棋。至此,AlphaGo也兌現了烏鎮人機大戰上許下的諾言:與全世界圍棋愛好者共同分享AlphaGo的數據。

伴隨著教學工具的上線,黃士杰也第一時間在自己的Facebook賬號上分享了感慨:AlphaGo教學工具已經發布,這也是我AlphaGo研究之旅的美好句點。我已經轉到DeepMind的其他專案,也將在深度學習與強化學習的AI研究上持續探索和精進。

黃士杰在自己的Facebook賬號上的留言

從2012年11月加入DeepMind,到AlphaGo項目的最初立項,再到陸續戰勝樊麾、李世石,此后又進化成Master,戰勝柯潔;再到今年10月份進化為AlphaGo Zero,最后發展為三類棋“通吃”,黃士杰一直是AlphaGo最核心的參與者。

回看黃士杰在DeepMind的這5年,或許能讓我們知道更多關于AlphaGo背后的故事。

Aja,我們準備啟動一個圍棋項目

2001年,黃士杰考入臺灣師范大學,開始自己的研究生學習,他的碩士畢業論文題目是《電腦圍棋打劫的策略》。到2004年,此時已經畢業一年,在學校當了一年的研究助理后的黃士杰,再次考入臺灣師范大學資訊工程研究所念博士。到了2011年6月,黃士杰的博士畢業論文答辯前夕,他就已經獲邀到加拿大阿爾伯塔大學攻讀博士后,并擔任電腦圍棋程序的研究員。當時,他的博士論文題目為《應用于電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》。

在整個時間線上,需要插一句的是, 2010年,戴密斯·哈薩比斯(Demis Hassabis)和大衛·席爾瓦(Dave Sliver)在倫敦成立了DeepMind。而當2011年,黃士杰到加拿大念博士后,并擔任研究員時,大衛·席爾瓦于前一年離開阿爾伯塔大學。

到了2012年,戴密斯·哈薩比斯、大衛·席爾瓦和黃士杰才在倫敦相遇,而那時AlphaGo項目可能連想法都還沒有形成。直到2014年1月,谷歌宣布用4億英鎊收購DeepMind,事情才有了質的突破。

據黃士杰回憶,有一天,席爾瓦走到他面前說:“Aja,我們準備啟動一個圍棋項目。最開始只有你和我”。當時團隊只有三個人:哈薩比斯、席爾瓦、黃士杰。哈薩比斯是整個公司的老板,席爾瓦是黃士杰的經理。從三個人的職位來看,黃士杰需要干的活可能是最多的。

黃士杰落子瞬間

給AlphaGo團隊當圍棋培訓師

除了專業受到DeepMind團隊青睞外,黃士杰對圍棋的熱愛也是團隊看中的因素之一。黃士杰從小熱愛圍棋,在臺師大讀書時就曾經創辦了學校的圍棋社,是個業余六段圍棋選手。除了愛下圍棋外,他還對電腦棋類程序競賽非常感興趣。他曾自己開發過一款圍棋程序,名為AjaGo。2010年,黃士杰開發的圍棋程序Erica,在當年的圍棋比賽中擊敗了日本著名“選手”Zen,獲得當年的冠軍。當時黃士杰在準備的博士論文也與圍棋程序相關,題為《應用于電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》。

隨著AlphaGo團隊的不斷壯大,越來越多計算機方面、深度學習領域的人才加入其中,團隊也不再只有3個人組成。但有個問題是,新加入團隊的工程師,可能之前并不了解圍棋規則,這就需要有人來為其普及知識。因此,黃士杰為新加入的同事辦了一個訓練班,普及基本的圍棋規則。

有了新力量的加入,AlphaGo項目的推進突飛猛進。2016年1月27日,《自然》雜志以封面論文的形式,介紹了DeepMind團隊開發的AlphaGo,以及它擊敗了歐洲冠軍樊麾的消息。實際上,自那時起,黃士杰就已經成為了AlphaGo的人肉臂。在與樊麾比賽前,他還曾告訴過樊麾,AlphaGo非常厲害,但那時,樊麾沒有聽進去,也大意了。或許不只是樊麾大意了,即便《自然》已公布AlphaGo的成功,那時候,仍沒有人能夠相信人工智能程序能戰勝人類職業棋手。直到同年3月份,它以4:1的成績打敗韓國棋手李世石,才真正意義上贏得了世界的刮目相看。

黃士杰

他是AlphaGo,但他又和AlphaGo不同

2016年3月9日至15日,AlphaGo和李世石在韓國大戰五個回合。最終AlphaGo以4:1取得勝利。當時坐在李世石對面,代替AlphaGo落子的還是黃士杰。這一次,他真正走入人們的視野,出現在電視轉播前面。

按照當時的比賽規則,每一次對弈,最長可能耗時近6個小時。據電視直播記錄,在與李世石的對弈過程中,黃士杰只喝過一次水,甚至一次洗手間都沒有去過。

“黃士杰是此次人機對弈中最辛苦受累的人,他擔心我會受到影響,對弈期間,他一直面無表情,甚至連一次洗手間都沒去過。”這是李世石賽后給予的評價,與柯潔的評價如出一轍。

黃士杰在比賽中的表現,讓人驚嘆,也是自那時起他有了AlphaGo人肉臂的稱號。作為AlphaGo的執棋手,要下好棋并不容易。戰勝了李世石后,AlphaGo以Master的名義在野狐圍棋平臺上以60:0的成績橫掃中日韓頂尖高手。在最后一盤棋結束后,Master現出真身:我是AlphaGo的黃士杰。

盡管成績傲人,但黃士杰曾在Facebook上透露,在Master對戰人類棋手取得60:0大勝過程,自己卻有過2個失誤。這是人代機器執子的過程中的人為失誤。而在一些圍棋網站的棋譜解析中,這兩步棋被認為是別出心裁的、有"非人類式"大局觀的著手。

到了今年5月,人機大戰移步中國烏鎮,坐在柯潔對面的仍是黃士杰。有一個細節值得一提,從直播鏡頭里看,當時柯潔旁邊的桌子上,除了一個水杯,還有兩盤水果和零食。而黃士杰這邊的桌子上,只有一個白色水杯。三場比賽都是如此的擺設。

相比比賽過程中,柯潔情緒的波動,黃士杰一直面無表情,冷酷地有點像冰冷的機器。即便有記者想上去采訪,當時也被“他們不讓我接受采訪”拒絕了。

結束與柯潔的對戰后,5月28日,黃士杰少見地在朋友圈發了一條狀態:“天下沒有不散的筵席,我轉往其他專案的時刻已到”。或許從那時候起,黃士杰就一直在為與AlphaGo的道別做準備了。

有時候,結束意味著新征程的開始,黃士杰在Facebook上說,這是自己到倫敦的第5年,他感謝家人的陪伴,但更多地,他開始期待前路,也希望自己的前路能一步步踏實的走下去。

    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            主站蜘蛛池模板: 深州市| 仙居县| 柳河县| 连山| 凉城县| 鄄城县| 肥乡县| 南部县| 栖霞市| 剑阁县| 宝鸡市| 奇台县| 花莲市| 西城区| 徐水县| 乾安县| 金塔县| 加查县| 玉门市| 自贡市| 弥勒县| 南江县| 凤冈县| 涟源市| 宜城市| 江陵县| 文登市| 平和县| 克东县| 东乌珠穆沁旗| 尖扎县| 驻马店市| 武强县| 文山县| 雅安市| 青冈县| 城市| 略阳县| 长宁县| 古丈县| 屏东市|