如何使用pandas只对变量的一部分进行比较？

dividas_dep = pd.read_csv("dividas_deputados_ajustado_csv.csv",sep=';',encoding = 'latin_1') dividas_dep.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 106 entries, 0 to 105 Data columns (total 10 columns): CPF_Deputado 106 non-null object CPF_limpo 106 non-null int64 Nome_Deputado 106 non-null object Vinculo 106 non-null object CNPJ_Devedor 106 non-null object CNPJ_limpo 106 non-null int64 Nome_Devedor 106 non-null object Valores_situacao_Irregular 65 non-null object Valores_situacao_Regular 52 non-null object Total_Devido 106 non-null object dtypes: int64(2), object(8) memory usage: 8.4+ KB

funrural = pd.read_excel('DEVEDORES FUNRURAL ATUALIZADO PGFN.xlsx') funrural.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 8130 entries, 0 to 8129 Data columns (total 14 columns): PSFN_PGFN 8129 non-null object Regiao 8129 non-null object CNPJ_CEI_Tipo 8129 non-null object CNPJ_Raiz 8129 non-null object Razao_Social 8130 non-null object Valor_principal 8130 non-null float64 Valor_TR_IPC_Poup 8130 non-null float64 Valor_Juros 8130 non-null float64 Valor_SELIC 8130 non-null float64 Valor_Encargo 8130 non-null float64 Valor_Multa_Oficio 8130 non-null float64 Valor_Selic_M_Oficio 8130 non-null float64 Vl_Multa_Mora 8130 non-null float64 Vl_Tot_Credito 8130 non-null float64 dtypes: float64(9), object(5) memory usage: 889.3+ KB

1条回答

网友

1楼 · 发布于 2024-04-20 03:31:33

您可以将前10个字符串元素的片段与.str.slice(None, 10)进行比较：

dividas_dep["CNPJ_Devedor"].str.slice(None, 10) == funrural["CNPJ_Raiz"]

示例：

>>> dividas_dep = pd.DataFrame({"CNPJ_Devedor": ['17.080.201/0001-49', '76.205.723/0001-99', '04.885.828/0001-25']})
>>> funrural = pd.DataFrame({"CNPJ_Raiz": ['17.080.201', '04.244.173', '05.006.407']})
>>> dividas_dep["CNPJ_Devedor"].str.slice(None, 10) == funrural["CNPJ_Raiz"]
0     True
1    False
2    False
dtype: bool

您可以使用结果创建新的数据帧：

res = dividas_dep["CNPJ_Devedor"].str.slice(None, 10) == funrural["CNPJ_Raiz"]
funrural[res]

相关问题更多 >

编程相关推荐

热门问题

热门文章