使用sklearn时标签由多个输入组合而成

1 投票

1 回答

29 浏览

提问于 2025-04-14 16:28

我正在对一个数据集进行分析，这个数据集里的分类标签是相互关联的。我的标签跟实验条件有关。在我的例子中，这些标签记录了两种化学物质的不同浓度组合，而这些组合会产生通过n个特征来测量的结果。

使用这些分类标签来代替化学物质浓度组合的做法是否是最佳实践，还是有更好的方法呢？

下面是分类标签和它所代表的实际条件之间的一个示例。

最佳实践 sklearn 分类标签化学物质浓度特征测量数据集分析关联标签实验条件

1 个回答

你选择的方法效果好不好，主要取决于你数据的质量和数量。想想你有多少样本，以及你想要建模的现象有多复杂——特别是模型能否把问题普遍化。我建议你可以尝试两种方法，看看哪种更合适。

也就是说，你需要为标签建立一个分类模型，而为浓度建立一个回归模型。

回答于 2025-04-14 由 Python大师

分享举报