分类变量友好pandas数据帧
dummip的Python项目详细描述
快速启动
$ pip install dummipy
从盒子里拿出来…
from sklearn.linear_model import LinearRegression from dummipy import cereal type(cereal) # CategoricalDataFrame cereal.head() reg = LinearRegression() reg.fit(cereal[['mfr', 'vitamins', 'fat']], cereal.calories)
安装
你需要`pandas<;http://pandas.pydata.org/>;`,但是任何旧的 版本会成功的。中没有pandas版本 {TT3}$$文件,因此安装^ {TT4}$不会弄乱您的存在 SCI PY设置。
$ pip install dummipy
使用
就像任何旧的数据帧一样使用它。这就是它的全部。
import dummipy as dp df = dp.CategoricalDataFrame({ "x": range(5), "y": ["a", "b", "c", "a", "b"] }) df = pd.read_csv("foo.csv") df = dp.CategoricalDataFrame(df)