如何在Python3.8中创建包含公共id内另一行年龄的变量？

df = pd.DataFrame({'id': [1,1,2,2,2,3,3,4,4,4,5,5,6,6], 'rank' : [1,2,1,2,3,1,2,1,2,3,1,2,1,2], 'age' : [20,2,30,28,4,26,3,22,23,1,34,29,56,25], 'sex' : ['female','female','male','female','male','female','male','female','male','male','male','female','female','female'], 'care' : [np.nan,np.nan,3,np.nan,np.nan,2,np.nan,np.nan,3,np.nan,np.nan,np.nan,2,np.nan]})

2条回答

网友

1楼 · 编辑于 2024-06-08 08:04:04

你想要这样的吗

new = pd.Series([2,np.nan,4,np.nan,np.nan,3,np.nan,np.nan,1,np.nan], name="new")
new_df = pd.concat([df, new], axis=1)
print(new_df)

"""
   id  rank  age     sex  care  new
0   1     1   20  female   2.0  2.0
1   1     2    2  female   NaN  NaN
2   2     1   30    male   3.0  4.0
3   2     2   28  female   NaN  NaN
4   2     3    4    male   NaN  NaN
5   3     1   26  female   2.0  3.0
6   3     2    3    male   NaN  NaN
7   4     1   22  female   NaN  NaN
8   4     2   23    male   3.0  1.0
9   4     3    1    male   NaN  NaN
"""

网友

2楼 · 编辑于 2024-06-08 08:04:04

试试这一行：

result = pd.merge(
    df,
    df[['id', 'rank', 'age']].rename(
        columns={'rank': 'care', 'age': 'new'},
    ),
    how='left',
)

结果正是您想要的：

>>> result
   id  rank  age     sex  care   new
0   1     1   20  female     2     2
1   1     2    2  female  <NA>  <NA>
2   2     1   30    male     3     4
3   2     2   28  female  <NA>  <NA>
4   2     3    4    male  <NA>  <NA>
5   3     1   26  female     2     3
6   3     2    3    male  <NA>  <NA>
7   4     1   22  female  <NA>  <NA>
8   4     2   23    male     3     1
9   4     3    1    male  <NA>  <NA>

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在Python3.8中创建包含公共id内另一行年龄的变量？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >