MNIST数据集中用于图像分类的关键特征是什么

1条回答

网友

1楼 · 发布于 2024-04-24 08:36:51

首先，网络管道由3个主要部分组成：

与常规的机器学习管道不同，你必须手动提取特征，CNN使用过滤器。（像在边缘检测或维奥拉和琼斯过滤器）。在

如果一个过滤器在图像上运行，并与像素卷积，它会产生一个输出。在

这个输出然后由一个神经元来解释。如果输出高于阈值，则被视为有效（如果有效，阶跃函数计数为1，如果是Sigmoid，则其在Sigmoid函数上有一个值）。在

接下来的步骤与之前相同。在

这一直进行到解释层（通常是softmax）。这一层解释你的计算（如果过滤器很好地适应你的问题，你会得到一个很好的预测标签），这意味着你有一个很低的差异（y_guess-y_true_label）。在

现在你可以看到，对于y的猜测，我们将输入x乘以许多权重w，并对其使用函数。这可以看作是分析中的链式规则。在

为了获得更好的结果，必须知道单个权重对输入的影响。因此，你可以使用反向传播，它是对所有w的误差的导数。诀窍是你可以重用或多或少是反向传播的导数，而且它变得更容易，因为你可以使用矩阵向量表示法。在

如果你有你的梯度，你可以使用正常的最小化概念，你走在最陡的下降。（还有许多其他的梯度方法，如adagrad或adam等）。在

这些步骤将重复，直到收敛或达到最大时间。在

所以答案是：计算出的权重（过滤器）是检测数字和数字的关键：）