无监督学习:离散时间序列上的异常检测

2024-06-16 13:53:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在一个未标记的数据集上进行最后一年的项目,该数据集由风力涡轮机内部多个组件的振动数据组成

数据集:

我从4个风力涡轮机获得数据,每个涡轮机的间隔41510秒

关于10秒间隔数据:

  • 415个10秒间隔中的每个间隔包括发电机、齿轮箱等的振动数据(共14个特征)
  • 振动数据(14个特征)的分辨率为25.6kHz(每个间隔262144行)
  • 每天在不同时间记录一次10秒;一年多一点的数据

数据帧的头部,具有以下一些功能:

enter image description here

计划:

我目前的计划是

  1. 针对415个间隔中的每个间隔,从时域对每个不同传感器(齿轮箱、发电机等)进行快速傅立叶变换(FFT)。从FFT中,我能够提取频率信息以放入数据帧中。(来自FFT的统计数据,如每箱的频谱RMS)

  2. 为不同的组件构建不同的数据集

  3. 添加风速、风向、发电量等功能。

  4. 然后,我将构建能够检测异常的无监督的ML模型

使用的无监督模型是<强> Encoder Decorder < /强>和<强>聚类< /强><

问题:

  1. 看起来我有足够的数据来完成这类任务吗?415 间隔x 4个不同的涡轮机=1660排,约20个特征
  2. 是否应将数据视为时间序列?(每天随机抽取一次,每次10秒)
  3. 还有哪些其他无监督的ML模型/方法适合此任务

我希望写得很清楚。提前感谢您的任何意见


Tags: 数据标记模型功能fft间隔时间组件