加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_丽江站长网 (http://www.0888zz.com/)- 科技、建站、数据工具、云上网络、机器学习!
当前位置: 首页 > 站长资讯 > 动态 > 正文

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

发布时间:2016-03-13 01:43:11 所属栏目:动态 来源:雷锋网
导读:雷锋网按:本文来自 硬创公开课 | AlphaGo专场的分享。分享嘉宾:业余围棋5段,高飞龙。

这里我想举两个例子。

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

白棋136,按照最优解应该下在A位,在这样的相对封闭空间里,电脑应该不会在手段和目数的计算上出现失误。

但它这样决策,就说明它认为,虽然亏了一目,但这样的下法后续更不容易出现失误(或者类似),所以获胜概率提高了。还有一个让所有人头疼的例子:

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

如果说电脑前半盘的“缓手”当天还可以很快解释,那么右下角的这个“失误”就让很多人难以理解,只能认为电脑确实算错了,或者判断错了~由此认为电脑不是无懈可击。

这步棋按照人的思路,只需要跳在一四,黑棋将输的更快。

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

黑2是我随便摆的,意思是脱先。白1跳在这里,黑棋如果脱先,则白棋保留这样救出上方三子的手段,黑棋输的更惨。如果黑棋补棋,则丢掉先手,一样比实战惨。

可电脑为什么没有这么下?看过第二盘之后,我们对电脑的计算力有了新的认识,更多的人认为,电脑的计算水平应该不至于算不到这个变化,而是认为这个变化获胜的概率不如实战。

这同样是一个封闭空间,人类提出的下法是最优下法,这没有疑问,因为在这个空间里,人类可以穷尽所有变化。但是AG呢?它肯定也能。

我第一天晚上始终对这个局部想不明白,认为是电脑的失误,但第二日后慢慢觉得,它的决策模型,虽然我不知道怎么判断的概率,一定认为这些后续变化降低了获胜概率。

四、如何预测下一场比赛的胜负?

不知道。如果按照以上这些分析的判断,我会高估电脑一些。

也就是电脑很可能全胜,但出于感情,我支持李世石赢一盘。

我们看到电脑有些局部可能不选择最优解,这种“失误”到底是不是“失误”,在于有没有“人”能利用其获胜。

我有一个大胆的猜想,如果想要打败这一代的AI,很可能会是下一代的AI,而不是人类高手。

五、AlphaGo的围棋观和人类的不同

电脑从开始到最后,一直是获胜概率导向的,而人因为很难准确的判断概率,会以大量的棋理和判断来进行决策,但这些本身就包含获胜的概率。人类总结出的棋理,本就是获胜概率最高(人的判断)的下法。至于目数的赚和损,只是一些同质化的判断方式。

如果棋理的获胜概率被证明不够高,说明棋理不够好,人家的棋理本身就是在不断革新,逼近最优解的,所以一些所谓电脑不看棋理的说法其实没有意义,选择最优的规律,本身就是理,人将之用人类可以理解的方式解释出来,就成了棋理。只不过人类对围棋规律的发掘还不够深,我们并不是所有的一切认识都是对的。

简单一句话吧,不同地方太多了,但客观讲,程序下的有道理,人应该好好分析学习,当然,程序下的还不是完美的围棋,批判着学吧。(鲍云观点)

读者提问:“人们一直觉得围棋太复杂,计算机无法驾驭,结果忽然发现自己才是那个无法驾驭它的。”怎么看?

李理:我觉得是有一定道理的,其实以后人类也可以利用计算机来帮助训练棋感,从而离最优走法更近一步。现在中国象棋很多职业选手就利用了计算机来”做功课“,开发一些之前认为”不好“的走法。

我觉得人类应该要勇敢的承认自己的不足,然后利用自己的优势。而不是一定要跟机器比计算。用中国古代的观点,就是天人合一,人本身也是宇宙的一部分。

高飞龙:我一直以来的观点都可以解释。远在AlphaGo面试之前:

围棋的规律是客观存在的,人类更像是“发现”了围棋而不是“创造”了围棋,所以人类围棋的发展史就是不断逼近最优解,不断发现逼近最优解的“规律”的历史。

一代又一代顶尖棋手,不断的提高人类围棋水平的峰值,就是这么一个过程。

也因此,很多外行问棋手,历史上的某某和某某谁更强的类似问题,大家都会回答,后面的更强(一般都是)。

现在我们的计算工具已经如此发达,达到或超过了人类顶峰的水平,将来我们可以借助工具,更好的探索围棋规律,也因此,我个人很希望将来可以有一两台训练好的围棋程序供大家来学习(虽然我知道谷歌和脸书都是降维打击,志在人工智能而非志在围棋)。

高飞龙:至于一些各个角度进行嘲讽的声音,我认为口水终将湮没在历史的尘埃中。

AlphaGo虽然赢了,但是它又有什么弱点呢?

高飞龙:概率导向导致它可能不选择最优,所以局部变化可能出“错”,当然这两盘棋里,ag出现这种下法都是在赢定的情况下才下的,所以对人类来说没有意义,人类无法利用这些“错”获胜。

这种类似人类的“损目换缩小棋盘”的下法,需要强大的控制力,而它正显示了自己的控制力。

而前半盘,它的概率判断也同样可能有问题,但现在来看,似乎不见得比人类顶峰差,甚至更好~所以我想它的弱点,可能就在于它还不是“围棋上帝”。

(这对于被甩在身后的我们来说,似乎不像是弱点)随着它的变强,人类顶峰利用这些缝隙获胜的机会或越来越小,大致如此。 

题图来自:wordpress.com

欢迎扫描二维码,加入硬创公开课的公开分享群,我们也期待在后续的直播中继续切磋交流。也欢迎推荐和自荐分享嘉宾。

棋手眼中,AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

(编辑:应用网_丽江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读