棋手眼中，AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

发布时间：2016-03-13 01:43:11 所属栏目：动态来源：雷锋网

导读：雷锋网按：本文来自硬创公开课 | AlphaGo专场的分享。分享嘉宾：业余围棋5段，高飞龙。

这里我想举两个例子。

白棋136，按照最优解应该下在A位，在这样的相对封闭空间里，电脑应该不会在手段和目数的计算上出现失误。

但它这样决策，就说明它认为，虽然亏了一目，但这样的下法后续更不容易出现失误（或者类似），所以获胜概率提高了。还有一个让所有人头疼的例子：

棋手眼中，AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

如果说电脑前半盘的“缓手”当天还可以很快解释，那么右下角的这个“失误”就让很多人难以理解，只能认为电脑确实算错了，或者判断错了~由此认为电脑不是无懈可击。

这步棋按照人的思路，只需要跳在一四，黑棋将输的更快。

棋手眼中，AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

黑2是我随便摆的，意思是脱先。白1跳在这里，黑棋如果脱先，则白棋保留这样救出上方三子的手段，黑棋输的更惨。如果黑棋补棋，则丢掉先手，一样比实战惨。

可电脑为什么没有这么下？看过第二盘之后，我们对电脑的计算力有了新的认识，更多的人认为，电脑的计算水平应该不至于算不到这个变化，而是认为这个变化获胜的概率不如实战。

这同样是一个封闭空间，人类提出的下法是最优下法，这没有疑问，因为在这个空间里，人类可以穷尽所有变化。但是AG呢？它肯定也能。

我第一天晚上始终对这个局部想不明白，认为是电脑的失误，但第二日后慢慢觉得，它的决策模型，虽然我不知道怎么判断的概率，一定认为这些后续变化降低了获胜概率。

四、如何预测下一场比赛的胜负？

不知道。如果按照以上这些分析的判断，我会高估电脑一些。

也就是电脑很可能全胜，但出于感情，我支持李世石赢一盘。

我们看到电脑有些局部可能不选择最优解，这种“失误”到底是不是“失误”，在于有没有“人”能利用其获胜。

我有一个大胆的猜想，如果想要打败这一代的AI，很可能会是下一代的AI，而不是人类高手。

五、AlphaGo的围棋观和人类的不同

电脑从开始到最后，一直是获胜概率导向的，而人因为很难准确的判断概率，会以大量的棋理和判断来进行决策，但这些本身就包含获胜的概率。人类总结出的棋理，本就是获胜概率最高（人的判断）的下法。至于目数的赚和损，只是一些同质化的判断方式。

如果棋理的获胜概率被证明不够高，说明棋理不够好，人家的棋理本身就是在不断革新，逼近最优解的，所以一些所谓电脑不看棋理的说法其实没有意义，选择最优的规律，本身就是理，人将之用人类可以理解的方式解释出来，就成了棋理。只不过人类对围棋规律的发掘还不够深，我们并不是所有的一切认识都是对的。

简单一句话吧，不同地方太多了，但客观讲，程序下的有道理，人应该好好分析学习，当然，程序下的还不是完美的围棋，批判着学吧。（鲍云观点）

读者提问：“人们一直觉得围棋太复杂，计算机无法驾驭，结果忽然发现自己才是那个无法驾驭它的。”怎么看？

李理：我觉得是有一定道理的，其实以后人类也可以利用计算机来帮助训练棋感，从而离最优走法更近一步。现在中国象棋很多职业选手就利用了计算机来”做功课“，开发一些之前认为”不好“的走法。

我觉得人类应该要勇敢的承认自己的不足，然后利用自己的优势。而不是一定要跟机器比计算。用中国古代的观点，就是天人合一，人本身也是宇宙的一部分。

高飞龙：我一直以来的观点都可以解释。远在AlphaGo面试之前：

围棋的规律是客观存在的，人类更像是“发现”了围棋而不是“创造”了围棋，所以人类围棋的发展史就是不断逼近最优解，不断发现逼近最优解的“规律”的历史。

一代又一代顶尖棋手，不断的提高人类围棋水平的峰值，就是这么一个过程。

也因此，很多外行问棋手，历史上的某某和某某谁更强的类似问题，大家都会回答，后面的更强（一般都是）。

现在我们的计算工具已经如此发达，达到或超过了人类顶峰的水平，将来我们可以借助工具，更好的探索围棋规律，也因此，我个人很希望将来可以有一两台训练好的围棋程序供大家来学习（虽然我知道谷歌和脸书都是降维打击，志在人工智能而非志在围棋）。

高飞龙：至于一些各个角度进行嘲讽的声音，我认为口水终将湮没在历史的尘埃中。

AlphaGo虽然赢了，但是它又有什么弱点呢？

高飞龙：概率导向导致它可能不选择最优，所以局部变化可能出“错”，当然这两盘棋里，ag出现这种下法都是在赢定的情况下才下的，所以对人类来说没有意义，人类无法利用这些“错”获胜。

这种类似人类的“损目换缩小棋盘”的下法，需要强大的控制力，而它正显示了自己的控制力。

而前半盘，它的概率判断也同样可能有问题，但现在来看，似乎不见得比人类顶峰差，甚至更好~所以我想它的弱点，可能就在于它还不是“围棋上帝”。

（这对于被甩在身后的我们来说，似乎不像是弱点）随着它的变强，人类顶峰利用这些缝隙获胜的机会或越来越小，大致如此。

题图来自：wordpress.com

欢迎扫描二维码，加入硬创公开课的公开分享群，我们也期待在后续的直播中继续切磋交流。也欢迎推荐和自荐分享嘉宾。

棋手眼中，AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

（编辑：应用网_丽江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

东数西算工程进行时	超有料的 ASML 追光训
商品推广的主要逻辑是	奕目科技创始人李浩天