qcut在熊猫中是一个很重要的功能
但在正常的机器学习情况下,我们通常需要将数据分为训练数据和测试数据
让我举一个例子:
我有一个包含7个数据的数据集
In [5]: pd.qcut([1,4,3,2,5,3,4], 3, labels=False)
Out[5]: array([0, 1, 0, 0, 2, 0, 1])
但我想要的只是基于前5个元素的qcut。 最后两个,按前5个标签
因此,前5个应获得如下标签:
In [6]: pd.qcut([1,4,3,2,5], 3, labels=False)
Out[6]: array([0, 2, 1, 0, 2])
最后两个应该是[2, 1]
有什么优雅的方法可以做到这一点吗
我们可以做
cut
作为解决方法相关问题 更多 >
编程相关推荐