使用sklearn randomforestrestregressor时，我的数据帧的x值是多少？

2条回答

网友

1楼 · 编辑于 2024-06-01 05:26:23

您只有一个变量（LandAverageTemperature），所以很明显这就是您要使用的。你要找的是df.shift()函数，它可以改变你的值。使用此函数，您可以将过去值的列添加到dataframe。然后你就可以用t 1 month/day ago、t 2 months/days ago等来预测另一天/月的温度。你知道吗

你可以这样使用它：

for i in range(1, 15):
    df.loc[:, 'T–%s'%i] = df.loc[:, 'LandAverageTemperature'].shift(i)

您的列将是temperature，温度为T-1，T-2，最多14个时间段。你知道吗

关于什么是时间序列预测的合适模型的问题，本站点将不讨论这个问题，但是https://stats.stackexchange.com上有许多资源。你知道吗

网友

2楼 · 编辑于 2024-06-01 05:26:23

一般情况下，您可以将X特征矩阵用于除目标列之外的所有数据列。但在你的情况下，有几个并发症：

很多年来，您在大多数列中都有遗漏（空）数据。您可以从列车数据中排除这些行/年。或者排除缺少数据的列（这几乎是所有的列，这不好）。你知道吗
回归模型不能直接使用日期字段，您应该将日期字段拖到一些数字字段，例如“第一次观察的月数”。类似于（1750年）*12个月以上。或者/你可以把年和月放在不同的列中（如果你的数据中有一些“季节性”就更好了）。你知道吗
你有连续的时间数据在这里，所以可能是你不应该使用简单的回归。使用一些ARIMA/SARIMA/SARIMAX等所谓的时间序列模型，在您的案例中，这些模型逐月按顺序预测目标数据。这是一个很难学习的话题，但你一定要看看TS，因为如果不是今天，你将来会需要它的。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用sklearn randomforestrestregressor时，我的数据帧的x值是多少？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >