比较字典,只显示Python中的差异?

2024-05-14 05:38:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两本词典,想比较一下,列出它们的区别: 我想这样做,因为他们是字典,这是不那么容易后,检查其他答案在这里。另一种方法是把它们变成熊猫的数据帧?我想考虑同样的列,它们的顺序也不一样。所以检查应该按名字进行。你知道吗

例如,如果“KAEK”在名称、数据类型和长度上相同,则它们在第二个词典中的列出位置就要低得多,而不应仅仅因为两个词典中的顺序不同就认为它们不同。我该怎么做?你知道吗

pst.schema

{'properties': OrderedDict([('KAEK', 'str:12'),
              ('PROP_TYPE', 'str:4'),
              ('ORI_TYPE', 'int:1'),
              ('ORI_CODE', 'str:100'),
              ('DEC_ID', 'str:254'),
              ('ADDRESS', 'str:254'),
              ('NUM', 'str:9'),
              ('LEN', 'float:19.11'),
              ('AREA', 'float:19.11')]),
 'geometry': 'Polygon'}


pst2.schema

{'properties': OrderedDict([('OBJECTID_1', 'int:9'),
              ('OBJECTID', 'int:9'),
              ('FID_PERIVL', 'int:9'),
              ('DESC_', 'str:254'),
              ('PROP_TYPE', 'str:4'),
              ('Shape_Leng', 'float:19.11'),
              ('Shape_Le_1', 'float:19.11'),
              ('Shape_Area', 'float:19.11'),
              ('PARCEL_COD', 'str:254'),
              ('KAEK', 'str:50'),
              ('NUM', 'int:4'),
              ('DEC_ID', 'int:4'),
              ('ADDRESS', 'int:4'),
              ('ORI_CODE', 'int:4'),
              ('ORI_TYPE', 'int:4')]),
 'geometry': 'Polygon'}

我想把它们按顺序排列如下:

df = pd.DataFrame(pst2, columns=['NUM', 'DEC_ID','OBJECTID_1'])#place all the columns
#which doesn't work 

但如果真是这样,两本词典之间任何不同列的空白都会造成混乱。 例如,如果第一列中的列是:

A,B,C

第二点:

A,B,B2,C

无法正确比较。因此,比较应该按名称进行。你知道吗

总结:比较这些,看看是否有任何组合不同于其他组合。其他列中不存在的额外列或类似的内容:

'ADDRESS', 'str:254'         #from 1st dictionary
'ADDRESS', 'int:4'           #from 2nd dictionary

试图显示属于哪个词典:

 pprint(set(('d1', el) if el in d1.items() else ('d2', el) for el in d2))


{('d2', 'ADDRESS'),
 ('d2', 'DEC_ID'),
 ('d2', 'DESC_'),
 ('d2', 'FID_PERIVL'),
 ('d2', 'KAEK'),
 ('d2', 'NUM'),
 ('d2', 'OBJECTID'),
 ('d2', 'OBJECTID_1'),
 ('d2', 'ORI_CODE'),
 ('d2', 'ORI_TYPE'),
 ('d2', 'PARCEL_COD'),
 ('d2', 'PROP_TYPE'),
 ('d2', 'Shape_Area'),
 ('d2', 'Shape_Le_1'),
 ('d2', 'Shape_Leng')}

正确的做法是显示两部词典的不同之处。你知道吗


Tags: idaddresstypefloatelnumdec词典
1条回答
网友
1楼 · 发布于 2024-05-14 05:38:36

如果你只想找出两个有序图之间的对称差

from collections import OrderedDict

>>> d1 = {'properties': OrderedDict([('KAEK', 'str:12'),
...               ('PROP_TYPE', 'str:4'),
...               ('ORI_TYPE', 'int:1')...

>>> d1 = d1['properties']

>>> d2 = {'properties': OrderedDict([('OBJECTID_1', 'int:9'),
...               ('OBJECTID', 'int:9'),
...               ('FID_PERIVL', 'int:9')...

>>> d2 = d2['properties']

>>> from pprint import pprint
>>> pprint(d1)
OrderedDict([('KAEK', 'str:12'),
             ('PROP_TYPE', 'str:4'),
             ('ORI_TYPE', 'int:1')...

>>> pprint(d2)
OrderedDict([('OBJECTID_1', 'int:9'),
             ('OBJECTID', 'int:9'),
             ('FID_PERIVL', 'int:9')...

pprint(set.symmetric_difference(set(d1.items()), set(d2.items())))
{('ADDRESS', 'int:4'),
 ('ADDRESS', 'str:254'),
 ('AREA', 'float:19.11'),
 ('DEC_ID', 'int:4'),
 ('DEC_ID', 'str:254'),
 ('DESC_', 'str:254'),
 ('FID_PERIVL', 'int:9'),
 ('KAEK', 'str:12'),
 ('KAEK', 'str:50'),
 ('LEN', 'float:19.11'),
 ('NUM', 'int:4'),
 ('NUM', 'str:9'),
 ('OBJECTID', 'int:9'),
 ('OBJECTID_1', 'int:9'),
 ('ORI_CODE', 'int:4'),
 ('ORI_CODE', 'str:100'),
 ('ORI_TYPE', 'int:1'),
 ('ORI_TYPE', 'int:4'),
 ('PARCEL_COD', 'str:254'),
 ('Shape_Area', 'float:19.11'),
 ('Shape_Le_1', 'float:19.11'),
 ('Shape_Leng', 'float:19.11')}

那你想怎么用就怎么用?你知道吗

请求进一步编辑操作

>>> d3 = set.symmetric_difference(set(d1.items()), set(d2.items()))
>>> pprint(set(('d1', el) if el in d1.items() else ('d2', el) for el in d3))
{('d1', ('ADDRESS', 'str:254')),
 ('d1', ('AREA', 'float:19.11')),
 ('d1', ('DEC_ID', 'str:254')),
 ('d1', ('KAEK', 'str:12')),
 ('d1', ('LEN', 'float:19.11')),
 ('d1', ('NUM', 'str:9')),
 ('d1', ('ORI_CODE', 'str:100')),
 ('d1', ('ORI_TYPE', 'int:1')),
 ('d2', ('ADDRESS', 'int:4')),
 ('d2', ('DEC_ID', 'int:4')),
 ('d2', ('DESC_', 'str:254')),
 ('d2', ('FID_PERIVL', 'int:9')),
 ('d2', ('KAEK', 'str:50')),
 ('d2', ('NUM', 'int:4')),
 ('d2', ('OBJECTID', 'int:9')),
 ('d2', ('OBJECTID_1', 'int:9')),
 ('d2', ('ORI_CODE', 'int:4')),
 ('d2', ('ORI_TYPE', 'int:4')),
 ('d2', ('PARCEL_COD', 'str:254')),
 ('d2', ('Shape_Area', 'float:19.11')),
 ('d2', ('Shape_Le_1', 'float:19.11')),
 ('d2', ('Shape_Leng', 'float:19.11'))}

相关问题 更多 >