Python中文
首页
教程
问答
标签
搜索
登录
注册
ValueError:X每个样本有29个特征;应为84个
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在编写一个脚本,使用贷款俱乐部API来预测贷款是“全额支付”还是“注销”。我使用jobsciam持久化工具来构建这个模型。我遇到了一个ValueError,因为持久化模型中的列数与新原始数据中的列数之间存在差异。ValueError是由于为类别变量创建虚拟变量而导致的。模型中使用的列数是84,在本例中,使用新数据的列数是29。在</p> <p>在生成虚拟变量时,新数据的列数需要为84列,但我不确定如何继续,因为从API获取新数据时,只有分类变量“homeOwnership”、“addrState”和“purpose”的所有可能值的子集。在</p> <p>这是我目前正在测试的代码,从类别变量转换为虚拟变量开始,在模型实现时停止。在</p> <pre><code>#......continued df['mthsSinceLastDelinq'].notnull().astype('int') df['mthsSinceLastRecord'].notnull().astype('int') df['grade_num'] = df['grade'].map({'A':0,'B':1,'C':2,'D':3}) df['emp_length_num'] = df['empLength'] df = pd.get_dummies(df,columns=['homeOwnership','addrState','purpose']) # df = pd.get_dummies(df,columns=['home_ownership','addr_state','verification_status','purpose']) # step 3.5 transform data before making predictions df.drop(['id','grade','empLength','isIncV'],axis=1,inplace=True) dfbcd = df[df['grade_num'] != 0] scaler = StandardScaler() x_scbcd = scaler.fit_transform(dfbcd) # step 4 predicting lrbcd_test = load('lrbcd_test.<a href="https://www.cnpython.com/pypi/joblib" class="inner-link">joblib</a>') ypredbcdfinal = lrbcd_test.predict(x_scbcd) </code></pre> <p>下面是错误消息</p> ^{pr2}$
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以尝试在测试数据对象<code>lrbcd_test</code>上使用<code>x_scbcd</code>[StandardScaler object]的<code>transform</code>方法吗?这将创建测试数据的特征表示。在</p> <pre><code>ypredbcdfinal = lrbcd_test.predict(x_scbcd.transform(x_scbcd)) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么我的神经网络模型的准确性不能在这个训练集上得到提高?
7 回答
为什么我的神经网络模型的权重变化不大?
4 回答
为什么我的神经网络的成本不断增加?
1 回答
为什么我的神经网络的输入pickle文件是19GB?
9 回答
为什么我的神经网络给属性错误?“非类型”对象没有属性“形状”
10 回答
为什么我的神经网络训练这么慢?
3 回答
为什么我的神经网络输出错误?
1 回答
为什么我的神经网络预测适用于MNIST手绘图像时是正确的,而适用于我自己的手绘图像时是不正确的?
9 回答
为什么我的神经网络验证精度比我的训练精度高,而且它们都是常数?
2 回答
为什么我的私人用户间聊天会显示在其他用户的聊天档案中?
6 回答
为什么我的积分的绝对误差估计值大于积分(使用scipy.integrate.nqad)?
9 回答
为什么我的积层回归器得分比它的组件差?
10 回答
为什么我的移动方法不起作用?
2 回答
为什么我的稀疏张量不能转换成张量
7 回答
为什么我的稀疏张量不能转换成张量?
2 回答
为什么我的程序“停止”了?
3 回答
为什么我的程序一直试图占用所有可用的CPU
6 回答
为什么我的程序不使用指定的代理
10 回答
为什么我的程序不工作(python帮助中的反向函数)?
1 回答
为什么我的程序不工作时,我使用多处理模块
3 回答