加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_丽江站长网 (http://www.0888zz.com/)- 科技、建站、数据工具、云上网络、机器学习!
当前位置: 首页 > 站长资讯 > 动态 > 正文

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

发布时间:2016-03-13 01:43:11 所属栏目:动态 来源:雷锋网
导读:雷锋网按:本文来自 硬创公开课 | AlphaGo专场的分享。分享嘉宾:业余围棋5段,高飞龙。

雷锋网按:本文来自 硬创公开课 | AlphaGo专场的分享。

分享嘉宾:业余围棋5段,高飞龙。一并感谢业余围棋6段,鲍云对本次分享的友情支持。

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

一、围棋圈内怎么看待前两场的胜负

第一局比赛,过程中大部分棋手很可能出现了相当程度的误判,认为李世石一度占优,而第二局比赛后,职业高手们对AI的决策原理了解的越来越多,判断也不断地在改变。

第一局输掉后,大家的情绪都很低落,虽然知道这一天早晚会来,但事前都认为没这么快,人类应该还能抵抗一段时间,但第二局结束后,大家对AI的实力判断普遍调高,很多人甚至认为柯洁现在上了也未必能赢。当晚,大量的职业高手就进行了深度的反思和讨论,尤其是李喆六段。

(根据我得到的信息)AlphaGo在第一局中,对自身获胜概率的判断应该始终高于半数,也就是我们说的始终优势,而第二局中,它反而在中盘有一段时间认为获胜概率为半数,也就是预测和棋,这和大部分人类高手在解说时的判断完全不同,是一个非常有趣的现象。

但赛后经过深入的分析,我听到的声音越来越倾向于支持电脑的判断,也就是说,第一局棋,李世石的确没有优势过,而我们要重新审视电脑下出的那些“缓手”和“错着”

二、如何评价此前大家认为两局中人和机器双方的“失误”?

首先,正如我前面所说,我个人认同第一局中,李世石始终没有占据优势,所以,也就没有所谓转折点的说法。

电脑的确下出了一些从普通棋理来看有问题的下法,并且取得了胜利,但这不一定说明棋理完全是错的。

我想重复一下很多人都已经提过的一点,这也是我们审视棋局非常重要的信息:电脑行棋的决策,是依据对落点后续变化的获胜概率来判断的。

这里我想引用一下李喆六段在第一天晚上复盘的讲解:

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

电脑的这一步长,当场被所有人视为缓手。但是复盘时李喆认为,这一手棋不一定不好,甚至在电脑的决策中,这已经是最好的一手(其实这是肯定的,因为电脑就是这样选择的)。

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

如果电脑不补棋,黑棋在左上的出动可能极为严厉,当然这不是说白棋就一定不能这么下,只是这后面的变化相当复杂,电脑应该判断这样的获胜概率不如实战的下法,所以选择了实战的“缓手”补棋。

紧接着,还有一个关键处,当时所有人都认为电脑的下法简直不可理喻,但我们还是顺着电脑的逻辑来复盘,就有办法理解:

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

这步断,直接将大空送给黑棋,局部来说,是严重亏损的下法,但电脑选择了这个下法,然后所有人都认为黑棋已经明显优势,可局后AG团队却说AG始终判断自己优势,为什么?

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

左下白棋损了一大把,然后做了几个简单的准备性交换之后,下出了右边的点,这步点被所有人认为是精彩的“胜负手”,局后也认为是妙手,但我们可能忽略了一个可能:电脑早就将这步棋和其导致的后续变化算在了形势判断中。

也就是说,电脑知道这以后它将在右边一代走成后续的变化,这是它的“权利”,所以即使左下角白棋严重亏损,但抢到先手之后将右边的“权利”兑现,白棋仍然是优势。

而左下局部亏损的下法,可能让它赢的更少,但却缩小了棋盘,令盘上剩余的空间和变化都大大减少了,用人类的说法,就是缩小了棋盘并接近终点,这和AG的逻辑是一样的,只不过AG可以通过获胜概率来更精准的判断这一点。

所以AG在选择左上的缓手补棋,选择左下的亏损变化抢先手的时候,已经考虑了这所有的变化并将后续在右边点入占到的便宜计入形势判断,所有这些走完之后,棋盘大幅度减小并且白棋局面领先,从电脑的角度来看,自己的获胜概率一直在提高。

(当然,这里包含了一些我从他人处看来的观点,还包含了我个人的一些猜想式的判断,可能会过于高估电脑,但我认为我们应该高估而不应该低估,更何况从结果来看,这种猜想很可能是对的,AG就是看了这么远)

二、如何看待外界评价对弈中没有“打劫”的问题?

打劫包含很多转换的可能,对电脑来说可能会降低获胜概率,哪怕只是从90%降低到80%,所以它不选择打劫。即使对人来说也是这样,在赢棋的局面下,讲究简化局面减少变化,尽量不选择复杂的打劫,增加获胜的可能。

没打劫的棋也多了,没什么特别离奇的,打了也输,就是李没拼显得有点没骨气,很多人觉得他没有表现出人类的风采。(鲍云观点)

三、AlphaGo与人类走子的差异

很多人说AG和人类棋手下的不是一种围棋,它是以获胜概率为指向,而人是以局部赚几目亏几目来判断,其实不是这么简单。这种说法其实对人类围棋的高水平段不太了解。

正如我回答前一个问题所说,人类也会在逼近终局的时候,选择亏损但是缩小棋盘减少变化的方式,来逼近终点。这就是典型的以减少获胜目数来提高获胜概率的决策。只不过人类对概率的判断基于经验和直觉,应该比不上成熟之后的电脑的判断准确度。

但如果是最优解,也就是我们说的“围棋上帝”,很可能于此不同。我们现在的对局,是单一的全局获胜就全部获胜,输赢的目数多少其实没有意义。而人会失误,所以出现了我前述所言的目数换概率的决策方式。但如果现在有一个“神”,它穷尽了围棋所有的变化,根本不会失误,那当他跟李世石下的时候,会这样吗?

当然,无论如何他都能赢,那么从追求围棋最优解的角度来说,他就可能不使用目数换概率的决策,因为他获胜的概率一定是百分之百,那么对他来说,最优解就应该是尽量提高获胜目数。

(编辑:应用网_丽江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读