深度学习进入芯片领域，揭秘寒武纪神经网络处理器

发布时间：2016-03-17 09:39:16 所属栏目：动态来源：雷锋网

导读：中科院提出的深度学习处理器指令集被顶级会议接收，采用寒武纪深度学习处理器相对于x86指令集的CPU有。两个数量级的性能提升。

例如程序化交易中经常使用线性回归这类可解释性好、复杂度低的算法。在此背景下，寒武纪3号多用途机器学习处理器PuDianNao应运而生，当前已可支持k-最近邻、k-均值、朴素贝叶斯、线性回归、支持向量机、决策树、神经网络等近十种代表性机器学习算法。PuDianNao的主频为1GHz，峰值性能达每秒10560亿次基本操作，面积3.51mm2，功耗为0.596W（65nm工艺下）。PuDianNao运行上述机器学习算法时的平均性能与主流GPGPU相当，但面积和功耗仅为主流GPGPU百分之一量级。

（PuDianNao版图）

神经网络处理器的市场前景

在上世纪80年代，因人工智能无法达到公众/投资人的预期，导致整个行业陷入低谷。

近年来，随着算法、应用和工艺三个方面都发生了剧烈的变化，神经网络处理器涅磐重生。

深度学习进入芯片领域，揭秘寒武纪神经网络处理器

2006年， Hinton、LeCun和Bengio等人提出了深度学习方法，在深层人工神经网络的训练上取得了巨大的突破。

简单地说，深度学习方法在传统的人工神经网络训练中增加了一个预训练阶段，即用无监督学习对每一层网络进行一次专门的训练，然后才用有监督学习对整个网络进行总体训练。通过深度学习方法，人工神经网络的效果一举赶上甚至显著超过了支持向量机等其他机器学习方法，在IBM、谷歌、微软、科大讯飞、百度等公司很多工业级图像和语音处理应用上取得了非常好的效果。

为什么深度学习会有效，暂时还没有传统的统计学习理论方面的完美证明。目前一种比较直观的的解释是：分层预训练相当于对输入数据进行逐级抽象，这暗合生物大脑的认知过程比较（例如人脑就是一种深层的神经网络，在认知过程中会逐层将看到的原始图像或听到的原始声波最终抽象成语义符号）。

既然人工神经网络已经重新成为最有效的认知任务处理算法（至少是之一），只要人工智能健康发展，专门的神经网络处理器自然能随着产业发展而茁壮成长。

另外，随着日常生活显然需要进行大量的认知活动，自然而然地，计算机体系结构研究者的目光必须要从传统的科学计算转到认知任务上。事实上，很多大公司已经认识到这一点。Intel和IBM等传统的硬件厂商都已经成立了专门的部门进行认知任务处理的研究。而现在体系结构研究中最常见的测试集Parsec中近半数都是认知类的应用（如bodytrack、facesim、freqmine、streamcluster、vips等）。在认知任务已经成了当前计算机最主要的任务之一的情况下，用户和市场自然会有加速人工神经网络的需求。

深度学习进入芯片领域，揭秘寒武纪神经网络处理器

因此，笔者认为只要不发生社会和媒体过分炒作人工智能，最终导致整个行业陷入低谷的情况正如80年代已经发生过的情况，寒武纪的市场前景是非常值得期待的——寒武纪处理器失败的风险就是社会和媒体过分炒作人工智能，如果最后人工智能的发展速度达不到公众（投资人）预期（这必然会发生，例如现在很多媒体，甚至谷歌自己都发话天网就要造出来），那么整个领域都会陷入大低谷，覆巢之下焉有完卵。

至于将来寒武纪产业化成果几何，还请由时间去检验。

【作者介绍】铁流，微信公众号：tieliu1988

（编辑：应用网_丽江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/2

首页

东数西算工程进行时	超有料的 ASML 追光训
商品推广的主要逻辑是	奕目科技创始人李浩天