杨强：深度学习是富人的游戏我要颠覆它

发布时间：2016-08-13 14:37:41 所属栏目：动态来源：网易科技

导读：网易科技讯 8月12日消息，由中国计算机学会（CCF）主办、雷锋网承办的全球人工智能与机器人峰会（GAIR）在深圳召开，在峰会现场，香港科技大学教授杨强发表了名为《人工智能

从技术上来说，这种对话系统也分成两种，第一种最早出现的是基于规则，很多人专家来写这些规则，这些就像在符号领域，它的好处是很准确的，但是不好的地方就是很难扩展，和数据无关，对数据不够敏感。另外有很多不同的意外事件都不能应付，所以现在大家比较关注的是机器学习的算法。

我们在香港科技大学的实验室里面也在进行研究，我们研究的一个主要目的是说如果我们再把人工智能往前推进一步，在深度学习之后，到底还有哪些技术是下一个热点，我们关心的是明天的技术，这里我要说的是我们有一个三明治式的一个三层结构：第一层就是我们熟知的深度学习，这是一个递归的深度学习；在这个之上，我们有一个策略的学习器，叫做强化学习的学习器，在这里我要特别强调的是强化学习里面最难的一部分是当人工智能的机器人它不能全部观察周围的世界，只能部分观察，所以这个有一个很怪的名字，叫做基于部分观察的马尔可夫的决策过程，简化来说它是强化学习里非常难的阶段。第三个就是迁移学习，它能让我们把一个做好的模型迁移到一个新的领域来，所以我们希望这样一个系统它能具有以下这儿功能，比方说闲聊、推荐、引导、提醒、学习，这个我们看到如果它具有这些功能的话，它就像一个真人一样。

怎么达到这样呢？我们首先要有基本的对话功能，就是深度学习的对话功能，其次我们要有一个策略，这个策略要能引导对话的对象去完成一个任务。最后我们要能实现个性化，我们最好能够贴近用户，让用户跟它对话以后，这个体验觉得非常好，非常简洁明了。怎么才能达到这一点，这就是我们的一些例子，比方说我们现在和一个O2O的公司合作，用真实的数据来训练这个系统，这个绿色的就是用户提的问题，白色的是系统，我们这个中文名字叫做“魔镜系统”，就是白雪公主里面的魔镜，当然这是一个好的魔镜。

下面我给大家做一个演示，请把声音打开。

刚才的这个系统，它的演示，我们是把整个的对话系统给放到一个机器人的里面，让机器人通过语音跟我们回答，实际上这个真正的系统是在手机上可以和人交流的。

这里我要跟我们大家熟悉的一些系统来做比较，比方说小冰的话，左边是用户提的问题，绿色的，黄色这里是小冰的回答，这是真实的一个截图。我们看小冰虽然很调侃，我们也试着用siri来做回答，siri是基于搜索，它很多的就是抱歉没有找到匹配。

我们这样一个系统之所以研究它，是我们对背后的系统感兴趣，所以有这样的应用领域，我们刚刚讲的几个条件，首先我们有很明确的目标，有很好的反馈，有不断到来的数据，然后我们也有跨界的人才，我们和O2O公司的联络。另外这个问题最后我们是有非常明确的，不一定有明确的边界条件，使得我们最后把这个问题的表达就好像是在下围棋一样，因此我们这里面也可以考虑说我们现在谈话谈到这儿，到底离我们的目标有多远，这就好像在下棋里面我们有一个状态网络，我们对现在的状态有一个估算，同时我们可以往下问的不同的话，可以当做我们下面要下的棋子，所以这和阿尔法狗的思维有很相象的地方。

有一个非常有趣的现象，就是这样一个三层的模型，我刚才讲的深度学习和强化学习还有迁移学习，这样一个模型是非常通用的，对话领域是我们的适用场所，这样的模型把它放到完全不一样的应用领域去它也能工作，这就是通用型的发展目标，比如我们有的学生就把它应用在大家公认很难的领域，就是股市大势的预测。这是A股里面的某个股票，我们拿过去好多年的数据，十年的数据做训练，所有数据之间的连接，首先我们产生不同的状态，让这个状态之间能够互相迁移。其次是状态和状态之间的变化，我们用一个强化学习来模拟，最后我们发现深度学习的隐含层里面它自动产生出来的几百个状态，基本就把这几年的经济状况给了一个很完善的总结，所以它可以给一个非常好的大势的走向，我们也做了一些测试。

这个例子当然是在金融领域的一个小的试验，所以我应该说这个是我们有所保留的，但是我想说的事情是一旦我们对一个领域有了足够的了解，一旦这个领域足够的数据我们掌握了，我们就可以套用人工智能，刚刚讲的一个边界清晰的方法来解决它，以达到通用型的人工智能的目的。

我下面要讲的，最后一个题目就是如何能做到个性化，这里其实有两个题目：一个是我个人就是有一个很强烈的感觉，深度学习是离不开大数据的，大数据又离不开大公司，我们熟知的一些大公司都是大数据的拥有者，我们有一些中型和小型公司没有大数据，也没有这个能力去取得大数据。所以这里我说像深度学习，它的红利来自于特征的选取，特征的准确选取又离不开大数据，这些大数据只有富人才能得到。

强化学习是把重点放在另一个角度，就是反馈，就是世界对系统的反馈，这个反馈可以延迟，但是它的训练也离不开大数据，也是一个富人的游戏。我们要达到世界上每一个人都可以用到人工智能，我们一定要做这样的研究，就是如何能把一个大的模型，大数据训练出来的模型迁移到一个小数据的范围内，让它能在一个小数据上面也能起作用。它还带来一个副产品，这个副产品就叫做个性化，也就是如果我们让一个产品能够有很强的用户感觉，用户体验，那么我们一定要达到个性化的效果，这个就是我们之所以做迁移学习的目的。

什么是迁移学习呢？就是我们在一个数据领域已经有了很好的领域建立了非常好的模型，我们换一个模型也能让它应用，这样既节省了资源，又达到时间和效果的好处。所以这样的一个学习过程，把一个已有模型迁移到一个未知领域，就叫做迁移学习。所以我们人是自动地就会做这种举一反三的嫌疑学习了，比如我们学会骑自行车以后，我们又去学摩托车，发现很简单，我们打球、学语言、学物理化学也有很多这样的例子。迁移学习大家也有了将近十年的努力，也积累了大量的文献，这里我总结一下，通过几种不同的方式，我们可以达到迁移，每一种方式都是很直观的。第一种就是我们在数据集里面找到跟目标领域相似的数据，把这个数据放大多倍，这个叫做样本迁移，通过样本来达到迁移的目的。其次我们可以观察到有些相似的特征，然后利用这些特征，在不同的层次的特征，来进行自动的迁移，这种叫做特征迁移。然后我们还可以做到基于模型的迁移，这是这样的一个工作。利用上千万的图象来训练一个图象识别的系统，我们遇到一个新的图象领域，我们就不用再去找几千万个图象来训练了，我们就把原来的那个迁移到新的领域，所以在新的领域只用几万张图片就够，同样可以得到很高的效果，这叫做模型迁移，模型迁移的一个好处是我们可以区分，就是可以和深度学习结合起来，我们可以区分不同层次可迁移的度，相似度比较高的那些层次他们被迁移的可能性就大一些。最后我们也可以通过关系来进行迁移，比方说社会网络，社交网络之间的迁移。

（编辑：应用网_丽江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/3

首页

尾页

东数西算工程进行时	超有料的 ASML 追光训
商品推广的主要逻辑是	奕目科技创始人李浩天

杨强：深度学习是富人的游戏 我要颠覆它

杨强：深度学习是富人的游戏我要颠覆它