用python/pandas简化分类变量

users.language.value_counts() en 15011 zh 101 fr 99 de 53 es 53 ko 43 ru 21 it 20 ja 19 pt 14 sv 11 no 6 da 5 nl 4 el 2 pl 2 tr 2 cs 1 fi 1 is 1 hu 1 Name: language, dtype: int64

def language_groupings(): for i in users: if users.language !='en': replace(users.language.str, 'non-english') else: replace(users.language.str, 'english') return users users['language'] = users.apply(lambda row: language_groupings)

2条回答

网友

1楼 · 编辑于 2024-05-14 17:28:15

试试这个：

 users.language = np.where( users.language !='en', 'non-english', 'english' )

网友

2楼 · 编辑于 2024-05-14 17:28:15

这就是你想要的吗？你知道吗

In [181]: x
Out[181]:
      val
en  15011
zh    101
fr     99
de     53
es     53
ko     43
ru     21
it     20
ja     19
pt     14
sv     11
no      6
da      5
nl      4
el      2
pl      2
tr      2
cs      1
fi      1
is      1
hu      1

In [182]: x.groupby(x.index == 'en').sum()
Out[182]:
         val
False    459
True   15011

相关问题更多 >

编程相关推荐

热门问题

热门文章

用python/pandas简化分类变量

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >