王小川：没机器干得好就会被机器取代

发布时间：2016-03-26 05:45:32 所属栏目：动态来源：新浪科技

导读：王小川近日出席博鳌亚洲论坛，并参与了主题为“人工智能—探索生命疆界”的对话，在与正安中医创始人梁冬的对话中，王小川从近期火热的谷歌围棋程序AlphaGo谈起，深度解析

谷歌就是我不告诉你这个方法了，我也不知道方法是什么，像人下围棋也是棋感，跟人脸识别一样的。所以谷歌就把KGS的服务器上人类棋手六段以上对弈的30万盘棋放在机器面前，就是当前在什么局势下，人是怎么落子的，30万盘棋大概有接近三千万棋局和答案，就让它去学习，学习之后机器不仅把这30万盘棋学会了，它自己这个过程里面会产生对类似问题的分析能力，所以棋局变了之后，它也能够根据以前的经验，它能够去做判断。不是记住这30万盘棋，而是30万盘棋有个泛化能力，一下子就变成了人下棋的方法，数据表明，给它一个棋局，它往下怎么走子的仿人的能力达到了57%，就是每一百个子下下去，其中57个子跟人的第一个下法是一样的，这件事情已经有巨大的突破了。这件事情做完之后，剩下43%跟人不一样的不代表它不好，所以它具备了很高的棋力，根据评判，它已经达到了五六段的水平，学习了棋感的过程，以前教它靠搜索或者规则开始建立棋感。但这并不是谷歌能力能赢人的地方，毕竟30万棋下去只是六段，它跟人的思考能力还是有距离。

然后谷歌就进入了第三个阶段，觉得还不够，谷歌就把AlphaGo变成了神经分裂成两台机器了，就是按照刚才人下棋的方法它自己可以做少量随机的变换去下。就像金庸小说里的老顽童左右互博，有可能这局赢了，那局输了，就是自己跟自己打，打输的这台机器我告诉它你输了，打赢的我告诉你赢了，然后让机器倒着去推，你这步棋怎么没走好？

第三步的做法我不是给你答案也不是给你方法，只是在最终我告诉你在目标上是更接近还是更远了，你接近了我这个系统给你奖励，你赢了，然后让你倒着推，你要输了我就告诉你，自己回去算怎么输掉的——这就变成第三步的走法，这个走法也像是我们跟人互相之间的学习是有关系的。比如小孩子被杯子烫了，不是我告诉你不要碰，而是他自己感到痛苦，知道以后不能碰——这种学习我们叫做巩固学习或者增强学习，这个学习是既不给方法也不给你答案，而是只是让机器自己找到答案之后，我去评价你这个答案是让你更好了还是更差了。

这个时候机器就追逐赢的目标，而不是追求每一步棋怎么走。我认为这是跟人学习一样的，给你方法、给你答案还是最终只是评价你，但这个事情我们觉得机器在赢这件事情，在AlphaGo上是非常局限的，它的赢有两个条件：第一个只是下棋赢，赢棋是我的唯一目标；第二个，它经历的这个状态，在什么情况下下棋，只是在19×19的棋盘上，只是在一个封闭的环境中，这跟环境跟外界是没有关系的，所以它学习的数据是非常的少。所以我们今天如果下棋，把棋盘从19×19变成20×20，机器就傻了，它的环境发生变化了，如果是人下棋，变换棋盘其实对水平影响不大。

第二个，人还有种能力是把学到的经验转移到其他事情上去，我们知道围棋选手第一思维会很缜密，第二下棋里面教会他做一种利益交换，下棋不是光把别人就打掉了，他是在想到底走先手还是走后手，局势里面互相之间能够得到一种平衡，人的思考会把一个经验转移到其他领域里面去，他有这样的变化，而今天的机器还远不到，所以你叫它有意识有智能，它只是在一个局限的环境里下棋的一个机器。

AlphaGo之后的发展，可能是转移学习

我再补几个细节的东西，你刚刚题目叫转移学习，就是把一个领域学习的知识运用到其他领域去，这是DeepMind在做的一件事情。这个团队是英国的，谷歌大概花了四亿英镑全资做的收购，当时20人，现在200多人了。我们刚刚看到这个机器通过用监督学习把人类历史的30万盘棋先学会了，像人一样，然后再自己跟自己下去超越人，所以它是先学习人再超越人，是这样一个路径，就把人类四千年来人经验的提升甚至人类在棋问题上的进化变成自己的一个基础，然后再去超越进化，这个时候谷歌还干了另外一件事情，它就想我如果不要去学习人之前下棋的方法，或者下棋的这样一个答案，我就让这个机器自己跟自己下，一开始可能很傻，这两个机器随机落子，但是最后也能告诉你输赢，然后这个时候说你输了你赢了，让它从一个白痴开始去进化，是否它最后也能变成一个下棋的高手？现在在做这件事情了，这个时候这样的一台机器以下棋为目标的时候，它已经脱离了人之前的一种经验，有可能它会进化出来一台跟人走棋风格完全不同的机器。

比如中原武学有很多流派，一个人说想把中原武学都学会了，然后再研发自己的杜门绝迹，但是大体上你是个中原人，但如果这个人从来没有在中原呆过，一开始只是武功为基础，在另外一个地方训练，那可能就需要西域的一种打法，如果说这个机器过一段时间如果它能够把这个计划做成，可能谷歌宣布跟柯洁再打一仗，那他压力就更大了，它面对的不是有人类经验的棋手，而是完全进化出来的一个棋手，它的风格跟你完全不一样，它的目的不只是赢棋了，而是好奇智慧和经验从零开始进化的时候，是否只有人类这一条道路。

从这个延伸下去我们再想另外一个问题，如果机器的目的不是赢棋或者输棋，它的目的是这个机器能够存活下去，甚至能够产生自己的繁衍，把这个当成目标，同时机器不只停留在19×19的棋盘上，而是变成你要生存在地球，或者一个实验室里面，我觉得它们就在创造生命了，生命的本质无外乎在这几千万年里面自己存在下去，所以人开始进化，发展出两条腿两条手，发展出眼睛鼻子，开始有智力，甚至有了情感，有了社会的道德。

人工智能的“生命意识”和预测未来

（编辑：应用网_丽江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/5

首页

尾页

东数西算工程进行时	超有料的 ASML 追光训
商品推广的主要逻辑是	奕目科技创始人李浩天