擅长:python、mysql、java
<p>这是一个有点老的问题,但是当我在寻找同样的东西时,google首先把这个问题还给了我,我想把这个留给每个人,包括我未来的自己,会很有用的。在</p>
<p>显然,<code>sklearn</code>在<a href="https://scikit-learn.org/stable/modules/generated/sklearn.utils.resample.html" rel="nofollow noreferrer">sklearn.utils.resample</a>中提供了此功能:</p>
<pre><code>from sklearn import datasets
from sklearn.utils import resample
X, y = datasets.load_iris(return_X_y=True)
X_new, y_new = resample(X, y, stratify=y)
</code></pre>
<p>您可以使用<code>n_samples</code>参数控制样本量。默认情况下,它被设置为<code>None</code>,因此您可以通过替换获得<code>X.shape[0]</code>随机样本(因为这是为引导目的而设计的)。希望这对某人有帮助。在</p>