2024-04-24 08:36:51 发布
网友
我最近在学习神经网络,遇到了MNIST数据集。我了解到使用sigmoid成本函数来减少损失。训练结束后,对权重和偏差进行了调整,找到了一个最优的权重和偏差。我不明白的是,图像是根据什么分类的。例如,为了对患者是否患有癌症进行分类,年龄、位置等数据成为特征。在MNIST数据集中,我没有找到任何这些。我是不是遗漏了什么。请帮我拿这个
MNIST
首先,网络管道由3个主要部分组成:
与常规的机器学习管道不同,你必须手动提取特征,CNN使用过滤器。(像在边缘检测或维奥拉和琼斯过滤器)。在
如果一个过滤器在图像上运行,并与像素卷积,它会产生一个输出。在
这个输出然后由一个神经元来解释。如果输出高于阈值,则被视为有效(如果有效,阶跃函数计数为1,如果是Sigmoid,则其在Sigmoid函数上有一个值)。在
接下来的步骤与之前相同。在
这一直进行到解释层(通常是softmax)。这一层解释你的计算(如果过滤器很好地适应你的问题,你会得到一个很好的预测标签),这意味着你有一个很低的差异(y_guess-y_true_label)。在
现在你可以看到,对于y的猜测,我们将输入x乘以许多权重w,并对其使用函数。这可以看作是分析中的链式规则。在
为了获得更好的结果,必须知道单个权重对输入的影响。因此,你可以使用反向传播,它是对所有w的误差的导数。诀窍是你可以重用或多或少是反向传播的导数,而且它变得更容易,因为你可以使用矩阵向量表示法。在
如果你有你的梯度,你可以使用正常的最小化概念,你走在最陡的下降。(还有许多其他的梯度方法,如adagrad或adam等)。在
这些步骤将重复,直到收敛或达到最大时间。在
所以答案是:计算出的权重(过滤器)是检测数字和数字的关键:)
首先,网络管道由3个主要部分组成:
与常规的机器学习管道不同,你必须手动提取特征,CNN使用过滤器。(像在边缘检测或维奥拉和琼斯过滤器)。在
如果一个过滤器在图像上运行,并与像素卷积,它会产生一个输出。在
这个输出然后由一个神经元来解释。如果输出高于阈值,则被视为有效(如果有效,阶跃函数计数为1,如果是Sigmoid,则其在Sigmoid函数上有一个值)。在
接下来的步骤与之前相同。在
这一直进行到解释层(通常是softmax)。这一层解释你的计算(如果过滤器很好地适应你的问题,你会得到一个很好的预测标签),这意味着你有一个很低的差异(y_guess-y_true_label)。在
现在你可以看到,对于y的猜测,我们将输入x乘以许多权重w,并对其使用函数。这可以看作是分析中的链式规则。在
为了获得更好的结果,必须知道单个权重对输入的影响。因此,你可以使用反向传播,它是对所有w的误差的导数。诀窍是你可以重用或多或少是反向传播的导数,而且它变得更容易,因为你可以使用矩阵向量表示法。在
如果你有你的梯度,你可以使用正常的最小化概念,你走在最陡的下降。(还有许多其他的梯度方法,如adagrad或adam等)。在
这些步骤将重复,直到收敛或达到最大时间。在
所以答案是:计算出的权重(过滤器)是检测数字和数字的关键:)
相关问题 更多 >
编程相关推荐