向新数据帧追加预测

> import pandas as pd from sklearn.linear_model import LinearRegression > df = pd.read_excel("stats.xlsx") > df_nonull=df.dropna() > > model= LinearRegression() groups = [] results = [] level = [] > > for (group, df_nonull) in df_nonull.groupby('Job Code'): > X=df_nonull[['Job Level']] > y=df_nonull[['Stock Value']] > model.fit(X,y) > coefs = list(zip(X.columns, model.coef_)) > results.append(model.predict(735947)[0]) > groups.append(group) > > df_results = pd.DataFrame({'Job Code':groups, 'prediction':results}) > > print df_results.head(50)

2条回答

网友

1楼 · 编辑于 2024-06-01 03:01:13

可以使用下面的命令创建一个包含数据集值和预测值的单个数据帧。在

df_nonull.join(df_results,how="outer")

网友

2楼 · 编辑于 2024-06-01 03:01:13

假设输入数据和预测序列具有一致的索引。我想你需要的是pd.concat。在

import pandas as pd

>>> X = pd.DataFrame({'input': [i for i in range(10)]}) ## fake input data
>>> pred = pd.DataFrame({'prediction':[i-5 for i in range(10)]}) ## fake prediction data
>>> pd.concat([X, pred], axis=1)
   input  prediction
0      0          -5
1      1          -4
2      2          -3
3      3          -2
4      4          -1
5      5           0
6      6           1
7      7           2
8      8           3
9      9           4

我将特别推荐pandas（0.20.1），特别是关于concatenation的这一节。在

相关问题更多 >

编程相关推荐

热门问题

热门文章