想知道深度学习优化算法的原理？点我！快点我

发布时间：2019-08-20 14:18:54 所属栏目：经验来源：读芯术

导读：副标题#e# 深度学习是一个高度迭代的过程。必须尝试超参数的各种排列才能确定最佳组合。因此，在不影响成本的前提下，深度学习模式必须在更短的时间内进行训练。本文将解释深度学习中常用优化算法背后的数学原理。优化算法在算法f(x)中，优化算法可得到f(

RMS Prop是指均方根传播，与动量类似，它是一种抑制y轴运动的技术。前面的示例有助于理解其原理。为了更好地理解，这里将y轴表示为偏置b，把x轴表示为权重W。

凭直觉而言，当用一个大数除以另一个数时，结果会变得很小。该例中,第一个大数为db，第二大数为加权平均db²。引入了两个新的变量Sdb和SdW，跟踪db²和dW²的加权平均。db和Sdb相除得到一个更小的值，它抑制了y轴的运动。引入Ⲉ避免出现除以零的错误。对于 x轴上W的值的更新也有类似的直觉。

值得注意的是，这里以y轴为偏置b, x轴为权值W，以便更好地理解和可视化参数的更新。也可用类似的方法消除由任何偏置b(b1, b2，…，bn)或权值W(W1, W2，…，Wn)或两者引起的任何波动。同样，由于只有参数更新方法发生了更改，也可使用小批量处理方法和均方根优化器(RMS optimizer)。