在python3和pandas中,我有一个数据帧:
candidatos_senado.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 88 entries, 17 to 650
Data columns (total 26 columns):
cpf 88 non-null object
nome 88 non-null object
nome_completo 88 non-null object
partido 88 non-null object
uf 88 non-null object
cargo_parlamentar 88 non-null object
tipo 88 non-null object
classe 88 non-null object
numero 88 non-null object
único 88 non-null object
assunto 88 non-null object
data_inicial 88 non-null object
data_final 88 non-null object
andamento 88 non-null object
link 88 non-null object
transparencia 88 non-null object
conferencia 88 non-null object
data_conferencia 88 non-null object
resumo 88 non-null object
observacao 86 non-null object
link_noticia_tribunal_confiavel 33 non-null object
interessa 87 non-null object
ministro_relator 88 non-null object
processo_conectado 8 non-null object
situacao 88 non-null object
cadastro_push 88 non-null object
dtypes: object(26)
memory usage: 18.6+ KB
此数据框的每一行都有关于法律程序的信息,每行一个法院案例
“nome”列有人名,例如:
FULANO DE TAL
BELTRANO DA SILVA
SICRANO APARECIDO
NINGUEM AUGUSTO
“tipo”列只有两种类型:
INQ
AP
我计算了每个名称中有多少AP和多少INQ,并创建了一个数据帧:
conta = candidatos_senado.groupby(['tipo','nome']).size().reset_index()
conta.columns = ['type_of_court_case', 'name', 'count']
conta.reset_index()
index type_of_court_case name count
0 0 AP ALFREDO NASCIMENTO 1
1 1 AP IZALCI LUCAS 1
2 2 AP JOSÉ REINALDO 1
3 3 AP RENAN CALHEIROS 1
4 4 AP SÉRGIO PETECÃO 2
5 5 AP ZECA DO PT 2
6 6 INQ ALFREDO NASCIMENTO 5
7 7 INQ CRISTOVAM BUARQUE 1
8 8 INQ EDISON LOBÃO 7
。。。你知道吗
但我的计数只能在列中找到一个条件。你知道吗
“interesta”列已键入“sim”或“não”。你知道吗
我只想在“interesta”列中的线路有“sim”时计算AP或INQ的个数,如果没有这样的条件我应该忽略该线路
拜托,有人知道我怎么做吗?你知道吗
我认为首先需要用^{} 过滤
DataFrame
,如果可能的话,在interessa
列中使用另一个值:如果需要,也按
interessa
列计算:如果要使用原液:
如果只想按
tipo
列计数:样本:
相关问题 更多 >
编程相关推荐