我在用熊猫。去拿假人在使用tpot之前转换一些分类变量。我的问题是我有一个连续变量,比如时间,它被转换成类别,即使它是一个连续变量。这似乎不是所有情况下都会发生,但我不知道什么时候会发生。在
我测试了以下内容:
pd.isnull(my_dataframe).any()
所有的分类都是假的
^{pr2}$输出是
<class 'numpy.float64'>
但是当我这么做的时候
df_dummies=pd.get_dummies(my_dataframe)
df_dummies.columns
它为我的时间特性的每个值创建一个列。在
像这样:'时间(分钟)'u 2','时间(分钟)'u 3', '时间(分钟)'u 4','时间(分钟)'u 5','时间(分钟)'u 6','时间(分钟)'u 10', '时间(分钟)_15','时间(分钟)'u 16','时间(分钟)'u 20','时间(分钟)'u 25', '时间(分钟)_30'
你知道这里有什么问题吗?在
在 你的时间类别看起来像是被意外地转换成了
str
的某个地方。在输出
^{pr2}$您可以验证带有}对象。在
df_cast
的pd.get_dummies
的行为是否与您所经历的一致,并且在将任何字段强制转换为str
之前,它是否正确地处理了floats
、ints
和{相关问题 更多 >
编程相关推荐