鳳凰科技訊 北京時(shí)間1月13日消息,據(jù)科學(xué)日?qǐng)?bào)報(bào)道,在過(guò)去的半個(gè)多世紀(jì),游戲一直是人工智能(AI)領(lǐng)域新想法的實(shí)驗(yàn)臺(tái),產(chǎn)生的成功都標(biāo)記著意義重大的里程碑——超級(jí)國(guó)際象棋電腦“深藍(lán)”擊敗國(guó)際象棋大師加里?卡斯帕羅夫(Garry Kasparo)以及超級(jí)計(jì)算機(jī)沃森擊敗了危險(xiǎn)邊緣節(jié)目前冠軍肯?詹寧斯(Ken Jennings)和布拉德?魯特(Brad Rutter)。然而,打敗頂級(jí)人類(lèi)選手和實(shí)際破解一個(gè)游戲并非同一回事,而現(xiàn)在加拿大亞伯達(dá)大學(xué)科學(xué)學(xué)院計(jì)算機(jī)撲克研究小組( Computer Poker Research Group,簡(jiǎn)稱(chēng)CPRG )的研究人員首次破解雙人限注撲克(heads-up limit hold'em poker)的決勝法門(mén)。
圖為加拿大亞伯達(dá)大學(xué)科學(xué)學(xué)院計(jì)算機(jī)撲克研究小組
“撲克一直是過(guò)去40多年人工智能面臨的一項(xiàng)頗具挑戰(zhàn)性的問(wèn)題,而這個(gè)問(wèn)題到此結(jié)束?!毖芯渴紫髡?、科學(xué)學(xué)院的鮑靈(Bowling)這樣說(shuō)道。這項(xiàng)研究發(fā)表在1月9日的期刊《科學(xué)》上。撲克是具有不完整信息的游戲集合,玩家對(duì)過(guò)去事件并不具備完全的知識(shí)。現(xiàn)在最流行的撲克類(lèi)型是德克薩斯撲克。當(dāng)它只有兩名玩家(一對(duì)一的兩家對(duì)戰(zhàn))且只有固定的押注和次數(shù)時(shí),這就被稱(chēng)為雙人單挑限注撲克。由于比西洋棋更小,雙人限注撲克不完整信息的本質(zhì)導(dǎo)致它成為電腦玩或者需要解決的一個(gè)更有挑戰(zhàn)性的游戲。
“如果當(dāng)無(wú)止境的玩牌與以95%的置信程度上破解這副撲克牌之間不存在統(tǒng)計(jì)學(xué)角度的差異,那么我們就將這個(gè)游戲定義為可以破解的。” 鮑靈解釋道?!跋胂笠幌乱粋€(gè)人一小時(shí)玩200次牌,一天玩12小時(shí)不間斷需要連續(xù)玩70年。再想象一下更糟糕的情形,最大化的精神掠奪,對(duì)手的策略以及從來(lái)都不能犯一個(gè)錯(cuò)誤。”
雖然很多完整信息游戲(也就是玩家在做決策之前被告知在游戲中可能發(fā)生的一切)被破解,例如四子棋,沒(méi)有一個(gè)由人類(lèi)玩家玩的重要的非完整信息游戲被破解過(guò)。這些游戲更具挑戰(zhàn)性。雖然完整信息游戲可能是大眾客廳游戲里的不可缺少的一部分,它卻在真實(shí)世界的決策設(shè)定里非常罕見(jiàn)。
“這項(xiàng)結(jié)果背后的突破性進(jìn)展是一般算法的進(jìn)步,它使得任何類(lèi)型的大規(guī)模模型里的博弈推理變得更易駕馭?!?鮑靈解釋道。雖然看起來(lái)有趣,但博弈論一直被認(rèn)為具有重要的啟示意義,包括涉及安全的博弈應(yīng)用,例如在機(jī)場(chǎng)安檢地區(qū)、空中武警時(shí)間安排和海岸警衛(wèi)隊(duì)巡邏部署的系統(tǒng)。真實(shí)世界的決策設(shè)定幾乎總會(huì)涉及不確定性和信息缺失,高計(jì)算法,例如破解撲克所需要的算法,可以用于推動(dòng)未來(lái)的應(yīng)用。