我的数据框中有50个变量。46个为因变量,4个为独立变量(降水、温度、露水、雪)。我想计算依赖变量的互信息,而不是独立变量
现在,我正在使用以下公式计算它,但它花费了很长时间,因为我每次都必须更改我的y
X = df[['Temperature', 'Precipitation','Dew','Snow']] # Features
y = df[['N0037']] #target
from sklearn.feature_selection import mutual_info_regression
mi = mutual_info_regression(X, y)
mi /= np.max(mi)
mi = pd.Series(mi)
mi.index = X.columns
mi.sort_values(ascending=False)
mi
另一种方法是将自定义方法传递给
pandas.DataFrame.corr()
函数使用列表理解:
相关问题 更多 >
编程相关推荐