北京時間 3 月 13 日下午 4 點 44 分,人機大戰(zhàn)五番棋大戰(zhàn)第四場結(jié)束,世界圍棋冠軍李世石執(zhí)白在第 78 手下出“神之一手”戰(zhàn)勝 AlphaGo,在五局比賽中首次獲勝,但總比分仍以 1 比 3 落后。雙方的第五場比賽將于下周二中午 12 時舉行。
針對此次李世石的勝利,AlphaGo 創(chuàng)始人哈薩比斯表示李世石再次向大家證明他是一個傳奇:“李世石是一個出色的棋手,他對于 AlphaGo 表現(xiàn)的非常好,AlphaGo 最開始的時候表現(xiàn)的還是不錯的,我們以為他會在中盤的時候非常好,但是因為李世石給我們的 AlphaGo 帶來很大的壓力,所以說最后他沒有表現(xiàn)好。但是我們非常高興,這就是我們來到這的原因,我們要測試 AlphaGo 的極限,找到 AlphaGo 有沒有什么樣的弱點,通過這樣的方式我們在能夠不斷的改善我們的程序。”
哈薩比斯還表示:“AlphaGo 一開始它是自己跟自己比賽,然后進行學(xué)習(xí),這就意味著他有可能知識上還有缺陷,但是我們之前是沒有合適的棋手幫我們找到這個缺陷,我們來到這里就是要找到一個很好的棋手幫助 AlphaGo 找到他的缺陷。李世石先生的確推動了 AlphaGo 展現(xiàn)了自己的缺點,對于我們來講這是非常有價值的?!?/span>
此外,現(xiàn)場解說嘉賓麥克雷蒙表示這是一場有趣的比賽:“在比賽的中間部分,就是 78 手下李世石下的非常好,而且我有點驚訝。我想多數(shù)的對手都會感到驚訝,特別是 AlphaGo 也感到驚訝,這樣的一手實際上最終達到了中腹這部分能夠獲勝,這就是展現(xiàn)了李世石很有實力?!?/span>
針對 AlphaGo 在專業(yè)人士看來是錯誤的的問題,哈薩比斯回應(yīng)稱 AlphaGo 是原型的程序:“沒有到 beta 程度,只是在阿爾法階段,因此我們就是要來看一看他有什么樣的缺點,得在真正的圍棋比賽當中看到這一點。李世石是頂尖棋手,能夠幫助我們找到這樣的缺點,因此我們的確打了一場非常不錯的比賽。醫(yī)療是不一樣的東西,我們要更進一步的測試這個軟件,我們這樣一個軟件是在原型的階段,所以我們來到這里進行測試,這就是我們現(xiàn)在的情況?!?/span>
針對 AlphaGo 頭一次認輸?shù)膯栴},哈薩比斯回應(yīng)稱:“AlphaGo 通過計算勝利的可能性選擇有哪一手,要增加勝利的可能性,如果勝利的可能性低于閾值的話就認輸,它會告訴操作員。AlphaGo 是跟人一樣認輸?shù)?。AlphaGo 總是認為他的對手可能下出最好的手,所以說他這樣的計算就是要增加他最有可能勝的這樣一些勝率,就是他這一手跟他的原則是一致的,不管對手是什么樣的水平。”
在比賽中有評論稱李世石和 AlphaGo 信息不對稱,對此哈薩比斯回應(yīng)稱:“AlphaGo 不是針對李世石來進行訓(xùn)練的。我們用人類的棋局來培訓(xùn)它的,主要是從互聯(lián)網(wǎng)上下載了一些業(yè)余的棋譜對它進行訓(xùn)練,這些都是日常開展的。我覺得 AlphaGo 是通過自我的學(xué)習(xí),不斷的對弈,來不斷的成長的。我們并沒有專門就李世石對它進行培訓(xùn)。即使我們想要針對李世石對它進行培訓(xùn)的話,AlphaGo 也需要幾百萬的棋局對它進行培訓(xùn),如果只是 100 場是沒有辦法對它進行很好的培訓(xùn)的。因為它是需要幾百萬,上億的培訓(xùn)。”