回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有以下代码</p>
<pre><code> from sklearn.ensemble import ExtraTreesClassifier
from sklearn.cross_validation import cross_val_score
#split the <a href="https://www.cnpython.com/pypi/dataset" class="inner-link">dataset</a> for train and test
combnum['is_train'] = np.random.uniform(0, 1, len(combnum)) <= .75
train, test = combnum[combnum['is_train']==True], combnum[combnum['is_train']==False]
et = ExtraTreesClassifier(n_estimators=200, max_depth=None, min_samples_split=10, random_state=0)
min_samples_split=10, random_state=0 )
labels = train[list(label_columns)].values
tlabels = test[list(label_columns)].values
features = train[list(columns)].values
tfeatures = test[list(columns)].values
et_score = cross_val_score(et, features, labels, n_jobs=-1)
print("{0} -> ET: {1})".format(label_columns, et_score))
</code></pre>
<p>检查数组的形状:</p>
<pre><code> features.shape
Out[19]:(43069, 34)
</code></pre>
<p>以及</p>
<pre><code>labels.shape
Out[20]:(43069, 1)
</code></pre>
<p>我得到:</p>
<pre><code>IndexError: too many indices for array
</code></pre>
<p>回溯的相关部分是:</p>
<pre><code>---> 22 et_score = cross_val_score(et, features, labels, n_jobs=-1)
</code></pre>
<p>我正在创建来自Pandas数据帧的数据,我在这里搜索,看到了一些通过这种方法可能出现的错误的引用,但是不知道如何更正?
数据数组的外观:
特点</p>
<pre><code>Out[21]:
array([[ 0., 1., 1., ..., 0., 0., 1.],
[ 0., 1., 1., ..., 0., 0., 1.],
[ 1., 1., 1., ..., 0., 0., 1.],
...,
[ 0., 0., 1., ..., 0., 0., 1.],
[ 0., 0., 1., ..., 0., 0., 1.],
[ 0., 0., 1., ..., 0., 0., 1.]])
</code></pre>
<p>标签</p>
<pre><code>Out[22]:
array([[1],
[1],
[1],
...,
[1],
[1],
[1]])
</code></pre>