使用sklearn时标签由多个输入组合而成

1 投票
1 回答
29 浏览
提问于 2025-04-14 16:28

我正在对一个数据集进行分析,这个数据集里的分类标签是相互关联的。我的标签跟实验条件有关。在我的例子中,这些标签记录了两种化学物质的不同浓度组合,而这些组合会产生通过n个特征来测量的结果。

使用这些分类标签来代替化学物质浓度组合的做法是否是最佳实践,还是有更好的方法呢?

下面是分类标签和它所代表的实际条件之间的一个示例。

条件 化学物质1 化学物质2
1 1 0
2 2 0
3 0 1
4 0 2
5 1 1
6 1 2

1 个回答

1

你选择的方法效果好不好,主要取决于你数据的质量和数量。想想你有多少样本,以及你想要建模的现象有多复杂——特别是模型能否把问题普遍化。我建议你可以尝试两种方法,看看哪种更合适。

也就是说,你需要为标签建立一个分类模型,而为浓度建立一个回归模型。

撰写回答