反向传播公式推导和理解
更新:矩阵形式的反向传播可以看 这里
引言
在深度学习中,模型的优化是通过采用梯度下降法不断更新权重和偏置项,让损失越来越小。其中的核心就是反向传播算法。回忆梯度下降的公式,用 $\theta$ 表示模型所有可学习的参数,$J$ 表示损失函数,$\alpha$ 表示学习率,那么有
更新:矩阵形式的反向传播可以看 这里
在深度学习中,模型的优化是通过采用梯度下降法不断更新权重和偏置项,让损失越来越小。其中的核心就是反向传播算法。回忆梯度下降的公式,用 $\theta$ 表示模型所有可学习的参数,$J$ 表示损失函数,$\alpha$ 表示学习率,那么有
最近,重新刷起了吴恩达的机器学习课程,系统性复习了之前学过的知识,发现又有不少收获,打算仔细整理一番👍
要谈论什么是线性回归首先要对什么是机器学习有一个基本的认识,什么是机器学习?抽象来说机器学习就是学习一个函数 $$ f(input) = output $$ 其中 $f$ 指的就是具体的机器学习模型。机器学习就是自动拟合输入 - 输出之间的关系的一套方法论。有时候我们会发现一些问题很难定义出一个具体的算法来解决,这时就是机器学习发光发热的地方了,我们可以让它从数据中自己学习、总结一些模式,做出相关的预测。这也是它和传统的算法(二分、递归等)区别的地方。不得不承认,机器学习从定义上来说就很迷人,它似乎为所有难以解决的问题提供了一套可行的解决框架。恰恰现实生活中的一些问题就是很难用传统算法解决的
更新:
今天我想要聊聊 Python 中用于解包(Unpacking)的两个操作符号——*
和 **
*
最为常见的用法是用来表示乘法。但我们也可以将 *
用于任意一个可迭代对象(iterable object)1上,表示我们想要提取里面所有的值