人类群星闪耀时 | Facebook人工智能负责人Yann LeCun：让深度学习摆脱束缚

发布时间：2016-03-16 21:15:13 所属栏目：动态来源：雷锋网

导读：人工智能经历了几次低潮时期，这些灰暗时光被称作“AI寒冬”。

LeCun：自始至终，我都一直深深沉迷于能够训练出一套完整的“端对端”系统。你将未经加工的数据输入系统，因为系统具有多层结构，每一层都将知道如何对上一层产生的表征进行转化，直到最后一层输出结果。该理念——从头到尾你都应该把学习融合进来，以便机器能够学习到好的数据表征——这就是我在过去三十年终所着迷的东西。

Spectrum：你的工作是符合黑客原则，还是科学原则？你是一直尝试到它们可以运行为止？还是会从洞悉理论开始？

LeCun：直觉洞察、理论模型、实际执行、实证研究与科学分析之间存在很多相互影响。洞察力是一种创造性思维；模型基于数学；实际执行涉及工程学和纯粹的黑客行为；实证研究和分析属于实实在在的科学。其中我最喜欢的是那些能够在实施中成功运行的简洁优美的理论。

有些人倾向使用某种理论的原因仅仅是因为它简单，或者他们不理会那些真正有用的理论的原因是它们太难了，我对这样的研究人员完全没有耐心。在机器学习领域存在一些这样的现象。事实上，从某种程度上来说，上世纪末本世纪初的“神经网络寒冬”就是那种“研究原则”所导致的。看似拥有坚不可摧的理论依据，但实证结果却没有价值，这非常不利于解决接下来的工程问题。

但采用纯粹的实证研究方法也有许多隐患。例如，语音识别领域一直保持实证研究的传统，只有当你的结果由于基准线时，才能得到本行业的关注。这扼杀了创造力，因为如果你想在测试结果上击败其他研究团队，而他们对此已经做了多年研究，那你首先应该潜心研究4-5年，建造自己的基本架构，这非常困难，且极具风险，因此没人这么做。所以对于整个语音识别领域，虽然研究进展连续不断，但都属于渐进式。

Spectrum：你看起来一直在竭尽全力的将你的工作与神经科学和生物学拉开距离。例如，你提到了“卷积网络”，而不是“卷积神经网络”。你在你的算法里提到了“单位/个体”（units），而非“神经元”。

LeCun：的确如此。我们模型中的一些部分从神经科学中获得了灵感，但还有相当多部分与神经科学毫不相干，相反，它们是来源于理论、直觉和经验探索。我们的模型不希望变成大脑的模型，我们也没有宣称神经科学方面的相关性。但同时，如果说卷积网络的灵感来源于一些关于视觉皮质的基础知识，我也可以接受。有些人间接从神经科学获得灵感，但他却不肯承认这一点，我承认，这（神经科学）很有帮助。但我会小心翼翼的不去触碰那些会引发大肆宣传的词语，因为这个领域已经出现了疯狂炒作，这非常危险。

四、大肆宣传的东西看起来像科学，但实际上不是

Spectrum：炒作毫无疑问是有害的，但你为什么说这是“危险的”？

LeCun：因为这给基金会、公众、潜在客户、创业公司和投资者带来了预期，他们会因此相信我们正处在风口浪尖——我们正在建造一些像大脑一样强大的系统，但实际上我们离这个目标还差的很远。这很容易导致另一次的“寒冬周期”。

这里会出现一些“草包族科学”（cargo cult science），这是理查·费曼的表达，指描述某些事物貌似科学，但实际上不是（译者注：这出自理查·费曼1974年在加州理工学院的一场毕业典礼演说，描述某些事物貌似科学，却遗漏了“科学的品德，也就是进行科学思考时必须遵守的诚实原则”）。

Spectrum：能举几个例子吗？

LeCun：在“草包族科学”下，你往往是复制了机器的表象，却没有深入理解机器背后的原理。或者，在航空领域，你制造飞机时会完全复制鸟类的样子，它的羽毛、翅膀等等。19世纪的人们很喜欢这么做，但取得的成就非常有限。

在人工智能领域也是如此，他们尝试着对我们所知晓的神经元和神经突触的所有细节进行复制，然后在一台超级计算机上启动一套庞大的模拟神经网络，希望从中孕育出人工智能，这就是“草包族科学”的人工智能。有许多拿到大笔基金支持的严肃的研究者基本上快要相信这些了。

Spectrum：你认为IBM的True North项目（译者注：IBM的类人脑芯片，集成了 54 亿个硅晶体管、 4096 个内核、100 万个“神经元”和2.56 亿个“突触”）属于“草包族科学”吗？

LeCun：这听起来会有些刺耳。但我的确认为，IBM团队所声称的东西有点偏差并容易造成误解。从表面上看，他们的公告令人印象深刻，但实际上没有实现任何有价值的东西。在True North之前，那个团队用IBM的超级计算机来“模拟了一个老鼠级别的大脑”，但这只是一个随机的神经网络，除了消耗CPU运算周期以外没有发挥任何作用。

True North芯片的悲剧在于它本来可以很有用，如果它当初没有坚持与生物学走的太近以及没有使用"spiking integrate-and-fireneurons"模型的话。因此在我看来——我曾是一个芯片设计者——当你在开发一个芯片之前，你必须确信无疑它能做些有用的事情。如果你打造了一个卷积网络芯片——很清楚如何去做——它能立刻应用到计算设备中。IBM创造了错误的东西，我们无法用它去完成任何有用的事情。

Spectrum：还有其他例子吗？

LeCun：从根本上说，欧盟人脑计划（Human Brain Project）中的很大部分也是基于这样一种理念：我们应该建造一种模拟神经元功能的芯片，越接近越好，然后将芯片用于建造超级计算机，当我们用一些学习规则来开启它时，人工智能就出现了。我认为这纯属胡说八道。

诚然，我刚才指的是欧盟人脑计划，并不是讽刺参与这个项目的每个人。许多人参与该项目的原因仅仅是因为它能获得巨额资助，这是他们所无法拒绝的。

五、无监督学习——机器需要的学习方式

Spectrum：对于一般意义上的机器学习，还有多少是有待发掘的？

LeCun：太多了。我们在实际的深度学习系统中使用的学习方式还是存在局限的。在具体实践中发挥作用的其实是“有监督学习”。你将一张图片展现给系统并告诉它这是一辆车，它就会相应调整它的参数并在下一次说出“车”。然后你再展现给它一把椅子、一个人。在几百个例子、耗费几天到几周的计算时间（取决于系统规模）之后，它就弄明白了。

但人类和动物不是这种学习方式。当你还是婴儿时，你并没有被告知你所看到的所有物体的名字。然而你却能学会这些物体的概念，你知道世界是三维的，当我把物体放在另一个的后面，你还是知道它的存在。这些概念不是与生俱来的，是你将它们学会了。我们把这种类型的学习称作“无监督”学习。

（编辑：应用网_丽江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/5

首页

尾页

东数西算工程进行时	超有料的 ASML 追光训
商品推广的主要逻辑是	奕目科技创始人李浩天