列车/Val/试验分时LSTM

2024-04-25 17:43:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个由几个月组成的数据集(从1月15日到9月17日),报告每个月的客户财务状况。我的任务是预测未来12个月每个客户的累计销售额。你知道吗

我的数据集看起来像这样(这是原始数据,为了训练,我将创建滞后特征)

Month   CustomerID NetSales
JAN-15     A          10
JAN-15     B          10
JAN-15     C          10
FEB-15     A          10
FEB-15     B          10
FEB-15     C          10
...

我如何在TRAIN/VAL/测试中与时间保持一致?我可以这样做吗?你知道吗

  • 培训-->;从1月15日到3月16日的所有客户/月(我每月在 至少一次,这样模型就可以了解季节性模式
  • VAL-->;从4月16日到6月16日的所有客户/月份
  • 测试-->;从7月16日到9月16日的所有客户/月份(我在这里停下来,因为我需要在12个月内完成以下步骤来创建目标变量)

这是一个一致的分割策略吗?另外,你有什么建议?你知道吗

非常感谢, 安德里亚


Tags: 数据gt原始数据客户报告val特征jan
1条回答
网友
1楼 · 发布于 2024-04-25 17:43:56

Is this a consistent split strategy?

是的,您尊重这样一个事实,即您没有将训练数据之前的数据用于验证集,测试集也是如此。您正在防止数据泄漏,这是正确的方法。你知道吗

In alternative, what would you advice?

你唯一可以改变的是你的火车的那部分,val,测试集,但是你可以尝试一下。由于这是一个时间序列,您应该考虑季节性趋势,它们都包含在您的培训数据中。你知道吗

相关问题 更多 >

    热门问题