如何计算整个数据集的成对互信息？

X = df[['Temperature', 'Precipitation','Dew','Snow']] # Features y = df[['N0037']] #target from sklearn.feature_selection import mutual_info_regression mi = mutual_info_regression(X, y) mi /= np.max(mi) mi = pd.Series(mi) mi.index = X.columns mi.sort_values(ascending=False) mi

2条回答

网友

1楼 · 编辑于 2024-06-11 22:02:53

另一种方法是将自定义方法传递给pandas.DataFrame.corr()函数

from sklearn.feature_selection import mutual_info_regression

def custom_mi_reg(a, b):
    a = a.reshape(-1, 1)
    b = b.reshape(-1, 1)
    return  mutual_info_regression(a, b)[0] # should return a float value
    
    
df_mi = df.corr(method=custom_mi_reg)

网友

2楼 · 编辑于 2024-06-11 22:02:53

使用列表理解：

indep_vars = ['Temperature', 'Precipitation', 'Dew', 'Snow'] # set independent vars
dep_vars = df.columns.difference(indep_vars).tolist() # set dependent vars

from sklearn.feature_selection import mutual_info_regression as mi_reg

df_mi = pd.DataFrame([mi_reg(df[indep_vars], df[dep_var]) for dep_var in dep_vars], index = dep_vars, columns = indep_vars).apply(lambda x: x / x.max(), axis = 1)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何计算整个数据集的成对互信息？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >