困难的数据帧查找查询

+----------+-----------+------------+-------------+--------------------+ | Survived | Surname | FamilySize | NumSurvived | FamilySurvivalRate | +----------+-----------+------------+-------------+--------------------+ | 0 | Braund | 2 | 0 | 0 | | 1 | Cumings | 1 | 1 | 1 | | 1 | Heikkinen | 1 | 1 | 1 | | 1 | Futrelle | 2 | 1 | 0.5 | | 0 | Allen | 2 | 1 | 0.5 | | 0 | Moran | 3 | 1 | 0.333333333 | | 0 | McCarthy | 1 | 0 | 0 | | 0 | Palsson | 4 | 0 | 0 | +----------+-----------+------------+-------------+--------------------+

+----------+-----------+------------+-------------+--------------------+ | Survived | Surname | FamilySize | NumSurvived | FamilySurvivalRate | +----------+-----------+------------+-------------+--------------------+ | 0 | Braund | 2 | 0 | | | 1 | Cumings | 1 | 1 | | | 1 | Heikkinen | 1 | 1 | | | 1 | Futrelle | 2 | 1 | | | 0 | Allen | 2 | 1 | | | 0 | Moran | 3 | 1 | | | 0 | McCarthy | 1 | 0 | | | 0 | Palsson | 4 | 0 | | +----------+-----------+------------+-------------+--------------------+

3条回答

网友

1楼 · 编辑于 2024-05-23 14:15:29

使用从df1和^{}创建的^{}by Series替换不匹配的值：

print (df2)
  Survived    Surname  FamilySize  NumSurvived
0         0     Braund           2            0
1         1   Cumings1           1            1 <- change surname for no match
2         1  Heikkinen           1            1
3         1   Futrelle           2            1
4         0      Allen           2            1
5         0      Moran           3            1
6         0   McCarthy           1            0
7         0    Palsson           4            0

s = df1.set_index('Surname')['FamilySurvivalRate']
df2['FamilySurvivalRate'] = df2['Surname'].map(s).fillna(0)
print (df2)
   Survived    Surname  FamilySize  NumSurvived  FamilySurvivalRate
0         0     Braund           2            0            0.000000
1         1   Cumings1           1            1            0.000000
2         1  Heikkinen           1            1            1.000000
3         1   Futrelle           2            1            0.500000
4         0      Allen           2            1            0.500000
5         0      Moran           3            1            0.333333
6         0   McCarthy           1            0            0.000000
7         0    Palsson           4            0            0.000000

网友

2楼 · 编辑于 2024-05-23 14:15:29

您可以尝试以下方法：

DF2.loc[DF2['Surname']==DF1['Surname'],['FamilySurvivalRate']] = DF1['FamilySurvivalRate']

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.loc.html

网友

3楼 · 编辑于 2024-05-23 14:15:29

您需要根据DF2中的条目合并两个数据帧，然后用0填充缺少的值：

(
    df2
    # Remove FamilySurvivalRate from DF2, as it is of not interest
    .drop(columns=["FamilySurvivalRate"]
    # Retrieve possibly existing values from df1
    .merge(df1, how="left")
    # Fill missing values with 0
    .fillna({"FamilySurvivalRate": 0})
)

相关问题更多 >

编程相关推荐

热门问题

热门文章