机器学习从当前数据中生成新数据

2024-06-16 14:22:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经从一些传感器测量和一些标签创建了一个数据集,并对其进行了分类,结果很好。但是,由于数据集中的数据量相对较小(1400个示例),我希望基于此数据生成更多数据。数据集中的每一行由32个数值和一个标签组成。在

我应该基于现有的数据集生成更多的数据集?到目前为止,我已经研究了生成对抗性网络和自动编码器,但我不认为这种方法适合我的情况。在

到目前为止,我一直在Scikit learn工作,但我也可以使用其他库。在


Tags: 数据方法网络示例分类情况对抗性传感器
1条回答
网友
1楼 · 发布于 2024-06-16 14:22:07

关键字在这里Data Augmentation。您可以使用可用的数据,并对它们稍作修改,以生成与源数据稍有不同的附加数据。在

请查看this链接。作者使用数据增强技术对猫图像进行旋转和翻转。因此,他从一张源图像中生成了6张不同视角的图像。 如果你把这个想法转移到你的传感器数据中,你可以在你的数据中加入一些随机噪声来增加数据集。您可以找到一个关于时间序列数据here的数据表示的简单示例。 enter image description here

另一种方法是窗口化数据并移动窗口一小步,因此窗口中的数据略有不同。在

stackexchange的人写了些什么。请查看this以了解更多信息。在

相关问题 更多 >