使用Python的双向方差分析

2024-05-13 19:00:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图做一个双向方差分析,我试图找到两个变量(B和M)对样本分类的重要性(由参数C给出)

我正试图重塑数据帧,使其适合statsmodels包。然而,我一次只能使用pd.melt包含一个变量(B或M)

任何关于如何使用这两个变量的值来执行双向方差分析的建议(就像下面给出的代码的最后两行一样)都会非常有帮助

B、M和C的值:

B : [10.,4.,4.,6.,5.]
M : [9.,6.,8.,4.,6.]
C : [1.,2.,2.,3.,1.]

import numpy as np
import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import ols
d = pd.read_csv("/Users/Hrihaan/Desktop/Data.txt", sep="\s+")
d_melt = pd.melt(d, id_vars=['C'], value_vars=['B'])
#model = ols('C ~ C(B) + C(M) + C(B):C(M)', data=d_melt).fit()
#anova_table = sm.stats.anova_lm(model, typ=2)

Tags: importapimodelas分类双向vars重要性