Python中文
首页
教程
问答
标签
搜索
登录
注册
用python/pandas简化分类变量
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在使用Kaggle上的airbnb数据集:</p> <pre><code>https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings </code></pre> <p>并希望将语言列的值简化为两组-英语和非英语。你知道吗</p> <p>例如:</p> <pre><code>users.language.value_counts() en 15011 zh 101 fr 99 de 53 es 53 ko 43 ru 21 it 20 ja 19 pt 14 sv 11 no 6 da 5 nl 4 el 2 pl 2 tr 2 cs 1 fi 1 is 1 hu 1 Name: language, dtype: int64 </code></pre> <p>我想要的结果是:</p> <pre><code>users.language.value_counts() english 15011 non-english 459 Name: language, dtype: int64 </code></pre> <p>这就是我想要的解决方案:</p> <pre><code>def language_groupings(): for i in users: if users.language !='en': replace(users.language.str, 'non-english') else: replace(users.language.str, 'english') return users users['language'] = users.apply(lambda row: language_groupings) </code></pre> <p>但这显然有点问题,因为当我对列运行value\u counts时,它返回一个空序列。你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>试试这个:</p> <pre><code> users.language = np.where( users.language !='en', 'non-english', 'english' ) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
Django:。是不是“超级用户”字段不起作用
6 回答
Django:'DeleteQuery'对象没有属性'add'
6 回答
Django:'ModelForm'对象没有属性
9 回答
Django:'python manage.py runserver'返回'TypeError:'WindowsPath'类型的对象没有len()
3 回答
Django:'Python管理.pysyncdb'不创建我的架构表
7 回答
Django:'Python管理.py迁移“耗时数小时(和其他奇怪的行为)
7 回答
Django:'readonly'属性在我的ModelForm上不起作用
10 回答
Django:'RegisterEmployeeView'对象没有属性'object'
7 回答
Django:'str'对象没有属性'get'
7 回答
Django:'创建' 不能被指定为Order模型表单中的值,因为它是一个不可编辑的字段
8 回答
Django:“'QuerySet'类型的对象不是JSON可序列化的”
7 回答
Django:“'utf8'编解码器无法解码位置19983中的字节0xe9:无效的连续字节”,加载临时文件时
2 回答
Django:“<…>”需要有一个字段“id”的值,然后才能使用这个manytomy关系
10 回答
Django:“AnonymousUser”对象没有“get_full_name”属性
2 回答
Django:“ascii”编解码器无法解码位置1035中的字节0xc3:序号不在范围内(128)
2 回答
Django:“BaseTable”对象不支持索引
8 回答
Django:“collections.OrderedDict”对象不可调用
10 回答
Django:“Country”对象没有属性“all”
1 回答
Django:“Data”对象没有属性“save”
3 回答
Django:“datetime”类型的对象不是JSON serializab
1 回答