如何根据不同数组中的标签分割数据集?

2024-04-20 12:49:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试分割我的数据集来训练神经网络

给定2个数组(datasetLabels

dataset是一个形状为(128,6,-1)的3D数组,而aslabels是一个包含dataset各自标签的1d数组

标签[0,0,0,0,1,1,1,1,2,2,2,2,2,2,2,2,2,2]中数据的Ex

我想根据标签分割数据,我的训练集和验证集的比率为0.7-0.3

我不想乱洗数据,而是希望得到以下结果 trainLabels = [0,0,0,1,1,1,2,2,2,2,2,2,2]及其在同一索引中对应的训练数据 和 evalLabel = [0,,1,2,2,2]也在同一索引中包含相应的训练数据

pandas、numpy或scikit learn是否有一个功能允许我这样做

我尝试过sklearn.model_selection.train_test_split,但是数据集被洗牌了

(一个不需要回答的额外问题:我可以洗牌我的数据集并拆分它们吗?有负面影响吗?)


Tags: 数据numpypandaslabels神经网络标签数组scikit