输入:
- 我有一个图像数组
X
,其中每一行都是代表一个人的示例。你知道吗 - 另一个数组
y
用于它们的标签,其中标签是1到7之间的整数。你知道吗 - 以及
ids
的最后一个数组,其中ids[i]
表示X[i]
处第i个人的id。(同一个人有同一个id,同一个人可能有不同的图像。)
有没有可能对X
和y
进行分区,这样同一个人就不会同时进入测试和训练集中?你知道吗
我想我需要使用sklearn.cross_validation.train_test_split。有人能解释一下“分层”是做什么的吗?这是我想做的正确方法吗?你知道吗
Tags:
Stratified sampling意味着
sklearn
将尝试将训练和测试分裂中的类的比率与总体数据的比率相匹配。你知道吗y标签中包含哪些信息? 听起来你需要像LabelKFold或LabelShuffleSplit这样的东西,在你的例子中,标签就是
ids
。你知道吗相关问题 更多 >
编程相关推荐