输入到LSTM的时间序列

2024-05-28 19:18:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含从不同地点采集的水样的数据集。例如,ABC1水样取自亚利桑那州的一条河流,ABC2水样取自波士顿的一条河流。它们都是河流,具有相同的特征列(pH、temp等),但它们位于不同的位置,因此特征的变化对它们来说是独立的。因此,我的目标是创建一个河流模型,因为我没有足够的数据来创建单个模型。总共有11列我想预测下个月的数值。我的数据集如下所示:

Date         Sample_Name        pH    temp    etc...

2009-01-01    ABC1              7.2    12
2009-01-02    ABC2              5.5    11
.
.
2009-01-02    ABC1              7.2    10
2009-01-02    ABC2              7.3    10
.
.
2013-06-02    ABC2              6.5    22
2013-06-04    ABC1              6.5    22
.
2015-01-05    ABC1              8.9    13
2015-01-05    ABC4              8.8    13

我想把每个样本及其序列输入一个LSTM模型。例如ABC1的每个测量值(行)必须作为序列或批次提供给模型。 是否可以使用TimeseriesGenerator进行此类数据准备?我如何准备数据,以便按照我所描述的方式将其提供给模型?使用日期和样本名称(按字母顺序)对数据集进行排序是否也有帮助I am trying to achieve something like this

我想使用以下方法生成数据:

from keras.preprocessing.sequence import TimeseriesGenerator
n_timesteps = 2
n_features = 10
batch_size = 5
generator = TimeseriesGenerator(df, df, length, sampling_rate = 10, stride = 1, batch_size = batch_size)

我想输入数据的简单LSTM模型:

from keras.models import Sequential
from keras.layers import LSTM, Dense
from keras.utils import Sequence

model = Sequential()
model.add(LSTM(n_features, activation='relu', input_shape=(n_timesteps, n_features)))
model.add(Dense(10))
model.compile(optimizer='adam', loss='mse', metrics = ['accuracy'])

Tags: 数据from模型importsizemodelbatchkeras
1条回答
网友
1楼 · 发布于 2024-05-28 19:18:00

查看docs,tf.keras.preprocessing.sequence.TimeseriesGenerator不能将字典作为第一个参数。“slice”错误只是这一事实的一种表现,因为函数尝试使用第一个参数(dict)的切片,但失败了。再次从文档中:

Arguments: data: Indexable generator (such as list or Numpy array) containing consecutive data points (timesteps).

因此,您可能希望传递input_dict['ABC1']或可能传递input_dict['ABC1'].values

相关问题 更多 >

    热门问题