当我有多个可变长度的时间序列数据时，如何使用Keras格式化LSTM网络的训练数据？

1条回答

网友

1楼 · 发布于 2024-04-26 10:45:06

就几点

pd.concat是你在这里的朋友。像这样使用

from pathlib import Path
import pandas as pd
dir_path = r"yourFolderPath"
files_list = [str(p) for p in dir_path.glob("**/*.csv")]
if files_list:
    source_dfs = [pd.read_csv(file_) for file_ in files_list]
    df = pd.concat(source_dfs, ignore_index=True)

然后您可以使用此df进行培训

现在，关于培训。嗯，这要视情况而定。如果你在那些CSV中有datetime，并且它们是连续的，那么就继续吧。如果在测量之间有中断，则可能会遇到问题。根据趋势、随机性和噪声，可以对缺失的数据进行插值。有多种方法，如朴素方法、用平均值填充方法、根据以前的值进行预测等等。没有对错之分，这实际上取决于数据的外观

编辑：注释不喜欢代码块。工作原理如下：例如：

#df1:
time    value
    1     1.4
    2     2.5

#df2:
time    value
    3     1.1
    4     1.0

#will be glued together to become df = pd.concat([df1, df2], ignore_index=True)
time    value
   1      1.4
   2      2.5
   3      1.1
   4      1.0

相关问题更多 >

编程相关推荐

热门问题

热门文章

当我有多个可变长度的时间序列数据时，如何使用Keras格式化LSTM网络的训练数据？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >