使用sklearn时标签由多个输入组合而成
我正在对一个数据集进行分析,这个数据集里的分类标签是相互关联的。我的标签跟实验条件有关。在我的例子中,这些标签记录了两种化学物质的不同浓度组合,而这些组合会产生通过n个特征来测量的结果。
使用这些分类标签来代替化学物质浓度组合的做法是否是最佳实践,还是有更好的方法呢?
下面是分类标签和它所代表的实际条件之间的一个示例。
条件 | 化学物质1 | 化学物质2 |
---|---|---|
1 | 1 | 0 |
2 | 2 | 0 |
3 | 0 | 1 |
4 | 0 | 2 |
5 | 1 | 1 |
6 | 1 | 2 |
1 个回答
1
你选择的方法效果好不好,主要取决于你数据的质量和数量。想想你有多少样本,以及你想要建模的现象有多复杂——特别是模型能否把问题普遍化。我建议你可以尝试两种方法,看看哪种更合适。
也就是说,你需要为标签建立一个分类模型,而为浓度建立一个回归模型。