如何使用pandas比较两列？

网友

1楼 · 编辑于 2024-04-20 06:47:36

只需将它们视为dict，就可以将它们与,分开。可以使用apply函数将自定义函数映射到列。在本例中，您定义了一个函数，该函数访问字典的键并提取值

df['address_raw'] = df['raw_data'].apply(lambda x: x['address'])
df['city_raw'] = df['raw_data'].apply(lambda x: x['CITY'])
df['addrline2_raw'] = df['raw_data'].apply(lambda x: x['ADDR_LINE_2'])
df['addrline3_raw'] = df['raw_data'].apply(lambda x: x['ADDR_LINE_3'])
df['utmnorthing_raw'] = df['raw_data'].apply(lambda x: x['UTM_NORTHING'])

这些行将在dict中创建每个字段的列，然后您可以比较以下字段：

df['address'] == df['address_raw']

网友

2楼 · 编辑于 2024-04-20 06:47:36

我将使用以下数据：

import numpy as np
import pandas as pd
j = {"address":"foo","b": "bar"}
j2 = {"address":"foo2","b": "bar2"}
values = [["foo", j], ["bar", j2]]
df = pd.DataFrame(data=values, columns=["address", "raw_data"])
df
    address raw_data
0   foo {'address': 'foo', 'b': 'bar'}
1   bar {'address': 'foo2', 'b': 'bar2'}

我将在另一个df（df2）中从原始数据（使用.values.tolist（））中分离列：

df2 = pd.DataFrame(df['raw_data'].values.tolist())
df2
    address b
0   foo bar
1   foo2    bar2

要进行比较，请使用：

  df.address == df2.address
0     True
1    False

如果需要将其保存在原始df中，可以添加一列：

df["result"] = df.address == df2.address

网友

3楼 · 编辑于 2024-04-20 06:47:36

df = pd.DataFrame([[2, 2], [3, 6],[1,1]], columns = ["col1", "col2"])
comparison_column = np.where(df["col1"] == df["col2"], True, False)
df["equal"] = comparison_column



col1  col2  equal
 2     2   True
 3     6  False
 1     1   True

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用pandas比较两列？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >