我做了一个代码,可以处理PATSY和FORMULA,但是现在我想用predict来验证我用summary找到的结果。那么我如何预测我的变量呢?在
import numpy as np
from scipy import stats
import scipy
import matplotlib.pyplot as plt
import statsmodels.api as sm
from statsmodels.formula.api import logit, probit, poisson, ols
FNAME ="C:/Users/lenovo/Desktop/table.csv"
my_data = np.genfromtxt (FNAME, delimiter = ',')
x = my_data [:,1]
d = my_data [:,4]
f=my_data[:,6]
c= my_data[:,3]
#crée un masque pour les valeurs nans
masque = ~ (np.isnan (x) | np.isnan (d) | np.isnan (f) | np.isnan (c))
x = my_data[masque, 1] - 1
d = my_data[masque, 4]
f = my_data[masque, 6]
c = my_data[masque, 3]
my_data_dict = dict (
x = x,
d = d,
f = f,
c=c
)
form = 'x ~ C(c)+C(d)+C(f)'
affair_model = logit (form, my_data_dict, manquant = 'drop')
affair_result = affair_model.fit ()
print affair_result.summary ()
在这一行中:
您只选择列
['a', 'b']
,然后与其他没有x
的DataFrame
连接。在简单的改变
^{pr2}$到
对于这样的一次性脚本,使用
assert
进行健全性检查,以确保它做了您期望的事情,例如由于}更改为
x
已重新添加到data
中,您还需要将{相关问题 更多 >
编程相关推荐