张量流一个热向量能影响模型学习吗?

2024-06-02 06:07:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我事先为我的英语表达感到抱歉。这对我来说很难。。你知道吗

我有一个神经网络的特点是在一个np数组和之前,我的特点是存储在一个张量模型训练。形状是(4000,6),因为我有6个不同的特征

我添加了一个词汇表功能。我把它转换成一个热向量,再转换成张量,结果的形状是(4000243)。你知道吗

在训练之前,我计算了这两个张量,得到了一个形状为(4000,249)的结果张量。你知道吗

我想知道我的学习是否会受到影响(6个特征和一个其他编码243个条目的张量)。 我很担心神经网络的应用。。你知道吗

这是一个问题还是我的6个第一特征将继续有一个最好的思考相比,243其他条目在张量?你知道吗

非常感谢你的回答和帮助。你知道吗


Tags: 词汇表模型目的功能编码np条目神经网络
1条回答
网友
1楼 · 发布于 2024-06-02 06:07:05

是的,您的担心是正确的,在表示模型时对其中一个特性使用一个热编码将是不好的,它将倾向于优先考虑不同的特性,现在优先考虑哪些特性将取决于几个标准。你知道吗

案例1:您已将其他输入标准化为介于0和1之间,在这种情况下,表示为一个热编码的特征将倾向于主导预测模型。你知道吗

案例2:您没有规范化其他输入,这将已经有灾难性的影响,但它将反击来自一个热编码向量的巨大影响。你知道吗

这些都不是机器学习场景的理想选择,我建议您删除特性的一个热编码,然后规范化数据集,只有在训练模型之后,才能确保所有特性都会影响基于预测输出的学习,而不会偏向于任何特定的特性功能。你知道吗

如果你有任何疑问或不理解某些东西的逻辑,请随时发表评论。你知道吗

相关问题 更多 >