我有一个由几个月组成的数据集(从1月15日到9月17日),报告每个月的客户财务状况。我的任务是预测未来12个月每个客户的累计销售额。你知道吗
我的数据集看起来像这样(这是原始数据,为了训练,我将创建滞后特征)
Month CustomerID NetSales
JAN-15 A 10
JAN-15 B 10
JAN-15 C 10
FEB-15 A 10
FEB-15 B 10
FEB-15 C 10
...
我如何在TRAIN/VAL/测试中与时间保持一致?我可以这样做吗?你知道吗
这是一个一致的分割策略吗?另外,你有什么建议?你知道吗
非常感谢, 安德里亚
是的,您尊重这样一个事实,即您没有将训练数据之前的数据用于验证集,测试集也是如此。您正在防止数据泄漏,这是正确的方法。你知道吗
你唯一可以改变的是你的火车的那部分,val,测试集,但是你可以尝试一下。由于这是一个时间序列,您应该考虑季节性趋势,它们都包含在您的培训数据中。你知道吗
相关问题 更多 >
编程相关推荐