损失函数为若干点的最小值，自定义损失函数和梯度

1条回答

网友

1楼 · 发布于 2024-05-15 23:32:23

在机器学习社区中，您正在考虑的是超集学习，这意味着，不是典型的有监督的设置，您有{（x_i，y_i）}形式的训练集，而是{（{x_1，…，x_N}，y_1）}，这样你就知道集合中至少有一个元素具有属性y_1。这不是一个很常见的设置，但现有的一些研究，谷歌在该领域的论文。在

就你自己的损失函数而言，scikit learn是不可能的。Scikit learn是关于简单性的，它为您提供了一套非常灵活的现成工具。它不是一个研究工具，你的问题是研究。你能用什么代替？我建议您使用任何符号微分解决方案，例如autograd，它使您能够通过python代码进行区分，只需在其上应用scipy.optimize.minimize就可以了！任何定制的损失函数都能正常工作。在

作为旁注-最小算子是不可微的，因此模型可能很难弄清楚到底发生了什么。你可以试着去做sum((Y - prod_x F(x_1, x_2) )^2)，因为乘法是可以很好地微分的，你仍然会得到类似的效果-如果至少有一个元素被预测为0，它将从其余元素中删除任何“1”答案。您甚至可以更进一步，使其在数值上更稳定，并执行以下操作：

if Y==0 then loss = sum_x log(F(x_1, x_2 ) )
if Y==1 then loss = sum_x log(1-F(x_1, x_2))

也就是说

^{pr2}$

您可以注意到与交叉熵成本的相似性，因为您的问题确实是一个分类。现在你有了完美的概率损失，你把每个片段的概率都附加到“坏”或“好”上，所以整个物体坏的概率要么高（如果Y==0）要么低（如果Y==1）。在

相关问题更多 >

编程相关推荐

热门问题

热门文章