我怎样才能创建一个深层的神经网络,它有能力为假设做出决定?

2024-06-07 10:05:24 发布

您现在位置:Python中文网/ 问答频道 /正文

基本上,我感兴趣的是解决一个假设问题,我只知道一个无效假设的数据分布,而对另一个情况一无所知。你知道吗

我关心的是,我应该如何训练我的深层神经网络,以便它能够分类或识别特定样本数据是否具有与零假设情况相似的分布,还是来自另一类(替代假设情况)。你知道吗

根据我的理解,它不同于二进制分类(一对所有的情况),因为在这种情况下,我们知道我们要处理什么数据,但在我的情况下,替代假设情况可以遵循任何数据分布。你知道吗

这里我给你举一个例子,我到底想要什么


假设我想预测一个人是否有可能患癌症

例如

我有一组导致癌症的因素,比如

Parameter A=1,Parameter B=3.87,Parameter C=5.6,Has cancer = yes

但我没有数据集

Parameter A=2,Parameter B=1.87,Parameter C=2.6,Has cancer = No


可以是这样的吗

也就是说,我不知道有什么可以得出没有癌症的结论,我还能训练我的模型来识别一个人是否有癌症吗?你知道吗


Tags: 数据parameter二进制分类情况神经网络感兴趣例子
2条回答

答案是肯定和否定。。。你知道吗

如果你对替代假设中数据点的分布一无所知,原则上它们可能与你已知的分布很接近,因此你总是(错误地)将它们归类为“我的假设”。那是不可能的部分。你知道吗

是的部分:你能做的是排除那些与你的假设完全不同的数据集,使它们不可能由相同的分布产生。这意味着原则上你可以做一个类似于“生成给定数据的概率小于some value”的语句。你知道吗

然而,我不认为神经网络一定是最好的方式作出这样的声明。它可以是足够的,适合一个模型(理想的是一个已知的模型。。。因此,如果你知道你有什么确切的分布,你应该使用它和拟合参数(而不是使用神经网络)到你的训练数据,然后只计算概率(例如使用贝叶斯推理)观察你的测试数据给定你的模型。有关更多信息,您可以查看this

如果你确信替代假设数据来自不同于零假设的分布,你可以尝试无监督学习算法。i、 一个K-均值或一个具有适当聚类数的GMM可以产生很大的数据分离。然后可以将标签分配给第二类数据,并使用它训练分类器。你知道吗

这是一种一般的半监督学习方法。你知道吗

另一个想法是将替代假设数据视为异常值,并使用异常检测算法来找到第二类数据点。这要实现起来困难得多,而且在很大程度上依赖于数据来自真正不同分布的假设。你知道吗

相关问题 更多 >

    热门问题