擅长:python、mysql、java
<p>错误是<code>randint</code>给出了一些重复的索引。您可以通过打印<code>len(set(ind))</code>来测试它,您将看到它小于5000。在</p>
<p>要使用相同的想法,只需将第一行替换为</p>
<pre><code>ind = np.random.choice(range(input_matrix.shape[0]), size=(5000,), replace=False)
</code></pre>
<hr/>
<p>也就是说,由于列表上的迭代,第二行代码相当慢。用布尔向量定义所需的索引要快得多,这将允许您使用否定运算符<code>~</code>。在</p>
^{pr2}$
<p>在我的机器上,这种方法与实现scikit.学习这让我觉得这两个人做的完全一样。在</p>