Python中部分依赖图的最小值/最大值(间隔)而不是平均值

2024-05-12 19:03:46 发布

您现在位置:Python中文网/ 问答频道 /正文

再见

我已经将lightGBM算法应用于房地产价格数据集(85524个观察值和167个特征)。我想得到的互动年与房地产面积大小到价格。因变量用log1p变换得到正态分布。在

我已经使用Python,pdpbox模块来生成一个交互图。根据我的理解,着色是变量之间的平均价格,但是,我想得到交互作用的间隔,即最小值和最大值。有可能吗?在

LGBMR.fit(df_train.drop(["Price"], axis = 1, inplace = False), df_train["Price"])

feats = ['Year', 'Real estate area']
p = pdp.pdp_interact(LGBMR, df, model_features = columns, features = feats)
pdp.pdp_interact_plot(p, feats, plot_type = 'grid')

enter image description here

我正在添加pdp交互图。例如,在2008年,0.52大小的房地产对象以5.697(预测)的平均价格购买,但我想知道这种相互作用的最低和最高预测价格。在


Tags: 数据算法dfplottrain价格特征price