^{
我有字符串数据整个^{
MTS RUS 495
Tele2 484
MegaFon 437
Beeline 431
Vodafone UA 402
...
3 Austria 1
FJ VODAFONE | Vodafone 1
Babilon-M 1
MOOV BENIN 1
3 | Beeline 1
Name: carrier, Length: 822, dtype: int64
这已经是绝对的,但是有太多不同的值(822!)
我想把它分为几个不同的值(5-10),每个值的高度都相等(比如strategy="quantile"
在KBinsDiscretizer
)
该算法非常简单:将KBinsDiscretizer
应用于转换为value_counts
中值的数值秩的数据
我想知道是否已经有了一种方法(如果没有,如何按照惯用的方式进行)
PS.一个关键的限制是该方法必须是“通用的”,我不能检查每个字符串列,我必须单独优化装箱
这是我放在一起的东西,看起来很有用,但我希望我能用一些OOTB:
相关问题 更多 >
编程相关推荐