梯度下降

程序员文章站 2021-12-08 11:03:02

梯度下降算法（gradient desent)以直线模型y=x*w为例数据集如下：xy122436cost(w)=(1N)∑n=1N(y^−y)2cost(w) = \left(\frac{1}{N}\right)\sum_{n=1}^N(\hat y-y)^2cost(w)=(N1)∑n=1N(y^−y)2梯度的方向一定是函数值上升的方向，最小值是0梯度下降公式：w=w−α∂cost∂ww = w - α\frac{\partial cost}{...

梯度下降算法（gradient desent)

以直线模型y=x*w为例

数据集如下：

x	y
1	2
2	4
3	6

$cost(w) = \left(\frac{1}{N}\right)\sum_{n=1}^N(\hat y-y)^2$

梯度的方向一定是函数值上升的方向，最小值是0
梯度下降公式： $w = w - α\frac{\partial cost}{\partial w}$ （α为学习率）

$\frac{\partial cost}{\partial w}$ = $\frac{1}{N}\frac{\partial }{\partial w}\sum_{n=1}^N(x_n*w-y_n)^2$

= $\frac{1}{N}\sum_{n=1}^N2x_n(x_n*w-y_n)$

python代码：

x_data = [1.0,2.0,3.0]
y_data = [2.0,4.0,6.0]
w = 1.0

def forward(x):
    return x*w

def cost(xs,ys):
    cost = 0
    for x,y in zip(xs,ys):
        y_pred = forward(x)
        cost +=(y_pred-y) ** 2
    return cost/len(xs)
def gradient(xs,ys):
    grad = 0
    for x,y in zip(xs,ys):
        grad+=2*x*(x*w-y)
    return grad/len(xs)

print('Predict (before training)',4,forward(4))
for epoch in range(100):
    cost_val = cost(x_data,y_data)
    grad_val = gradient(x_data,y_data)
    w-=0.01*grad_val
    print('Epoch:',epoch,'w=',w,'loss=',cost_val)
print('Predict (after training)',4,forward(4))

若曲线波动比较大，可以用指数加权均值平滑

$C^*_0 = C_0$

$C^*_i = αC_i+(1-α)C^*_(i-1)$

随机梯度下降（Stochastic gradient descent）

梯度下降公式： $w = w - α\frac{\partial loss}{\partial w}$

$\frac{\partial loss}{\partial w}$ = $2x_n(x_n*w-y_n)$

注意这里是对每一个样本求梯度，而梯度下降是对全部样本求梯度，这里就有一个很明显的问题，对于梯度下降在计算f(x)的梯度和计算f(x+1)的梯度是可以并行计算的，然而在随机梯度下降中显然是不行的，因为其计算每一个样本的梯度然后更新w，这个w又用于f(x+1)的计算，所以从时间复杂度上来看随机梯度下降差，但是性能上随机梯度下降好一些。

本文地址：https://blog.csdn.net/luoshiyong123/article/details/107283498

上一篇：短视频带货训练营招生中：名额有限，即将涨价！

下一篇：字节跳动战投部已解散

梯度下降

梯度下降算法（gradient desent)

以直线模型y=x*w为例

数据集如下：

随机梯度下降（Stochastic gradient descent）

1.2.1 Logistic回归和梯度下降简介

python+numpy+matplotalib实现梯度下降法

新冠疫情致全球智能手机2月销量下降14%：更糟糕的还在后面

premiere怎么给视频添加黑幕下降的效果?

2021适合捡漏的二本公办大学：录取分数线下降的大学有哪些？

Surface 3最客观的评价性价比大幅下降

关键字排名下降原因分析

3.26日百度更新致大量网站快照回档收录下降

近期，大批量网站排名下降的原因有哪些？

2010年1月份数据显示 bing提高google下降

梯度下降

梯度下降算法（gradient desent)

以直线模型y=x*w为例

数据集如下：

随机梯度下降（Stochastic gradient descent）

1.2.1 Logistic回归和梯度下降简介

python+numpy+matplotalib实现梯度下降法

新冠疫情致全球智能手机2月销量下降14%：更糟糕的还在后面

premiere怎么给视频添加黑幕下降的效果?

2021适合捡漏的二本公办大学：录取分数线下降的大学有哪些？

Surface 3最客观的评价 性价比大幅下降

关键字排名下降原因分析

3.26日百度更新致大量网站快照回档 收录下降

近期，大批量网站排名下降的原因有哪些？

2010年1月份数据显示 bing提高google下降

Surface 3最客观的评价性价比大幅下降

3.26日百度更新致大量网站快照回档收录下降