2024-06-16 14:22:07 发布
网友
我已经从一些传感器测量和一些标签创建了一个数据集,并对其进行了分类,结果很好。但是,由于数据集中的数据量相对较小(1400个示例),我希望基于此数据生成更多数据。数据集中的每一行由32个数值和一个标签组成。在
我应该基于现有的数据集生成更多的数据集?到目前为止,我已经研究了生成对抗性网络和自动编码器,但我不认为这种方法适合我的情况。在
到目前为止,我一直在Scikit learn工作,但我也可以使用其他库。在
关键字在这里Data Augmentation。您可以使用可用的数据,并对它们稍作修改,以生成与源数据稍有不同的附加数据。在
Data Augmentation
请查看this链接。作者使用数据增强技术对猫图像进行旋转和翻转。因此,他从一张源图像中生成了6张不同视角的图像。 如果你把这个想法转移到你的传感器数据中,你可以在你的数据中加入一些随机噪声来增加数据集。您可以找到一个关于时间序列数据here的数据表示的简单示例。
另一种方法是窗口化数据并移动窗口一小步,因此窗口中的数据略有不同。在
stackexchange的人写了些什么。请查看this以了解更多信息。在
关键字在这里
Data Augmentation
。您可以使用可用的数据,并对它们稍作修改,以生成与源数据稍有不同的附加数据。在请查看this链接。作者使用数据增强技术对猫图像进行旋转和翻转。因此,他从一张源图像中生成了6张不同视角的图像。 如果你把这个想法转移到你的传感器数据中,你可以在你的数据中加入一些随机噪声来增加数据集。您可以找到一个关于时间序列数据here的数据表示的简单示例。
另一种方法是窗口化数据并移动窗口一小步,因此窗口中的数据略有不同。在
stackexchange的人写了些什么。请查看this以了解更多信息。在
相关问题 更多 >
编程相关推荐