如何根据不同数组中的标签分割数据集？

2024-04-20 12:49:45 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试分割我的数据集来训练神经网络

给定2个数组（dataset和Labels）

dataset是一个形状为（128,6，-1）的3D数组，而aslabels是一个包含dataset各自标签的1d数组

标签[0,0,0,0,1,1,1,1,2,2,2,2,2,2,2,2,2,2]中数据的Ex

我想根据标签分割数据，我的训练集和验证集的比率为0.7-0.3

我不想乱洗数据，而是希望得到以下结果 trainLabels = [0,0,0,1,1,1,2,2,2,2,2,2,2]及其在同一索引中对应的训练数据和 evalLabel = [0,,1,2,2,2]也在同一索引中包含相应的训练数据

pandas、numpy或scikit learn是否有一个功能允许我这样做

我尝试过sklearn.model_selection.train_test_split，但是数据集被洗牌了

（一个不需要回答的额外问题：我可以洗牌我的数据集并拆分它们吗？有负面影响吗？）

Tags：数据 numpy pandas labels 神经网络标签数组 scikit

0条回答

目前没有回答