我的问题很简单-我有下表:
+----------+-------+------------+--------+
| industry | class | occupation | value |
+----------+-------+------------+--------+
| 170 | 4 | 1000 | 123.3 |
| 180 | 7 | 3600 | 4543.8 |
| 570 | 5 | 990 | 657.4 |
+----------+-------+------------+--------+
我想创建一个名为“type”的新列。此列的值基于这些多个条件
生成的表如下所示:
+----------+-------+------------+--------+------+
| industry | class | occupation | value | type |
+----------+-------+------------+--------+------+
| 170 | 4 | 1000 | 123.3 | IOP |
| 180 | 7 | 3600 | 4543.8 | QWE |
| 570 | 5 | 990 | 657.4 | JKL |
+----------+-------+------------+--------+------+
我的第一种方法基本上是使用dataframe查询方法创建每种类型的多个dataframe。但是,我发现了numpy“where”方法,目前我正在使用该方法的嵌套版本一步创建“type”列。然而,我觉得这是不可读的,我可以想象的情况下,有更多的条件,使这个过程看起来真的很混乱。有没有更干净的方法?也许用字典什么的?你知道吗
设置条件和输出并存储在列表中:
使用
np.select
。请注意,您有重叠的条件,因此IOP
和JKL
之间可能存在歧义相关问题 更多 >
编程相关推荐