Link of the data sets of csv file
链接包含.csv
文件,其中一列是状态名称和牙齿丢失数量。我想计算每个州儿童的平均牙齿脱落量。我试图使用df.interrows
,但无法对任何特定行的列值使用条件
for row in df.iterrows():
if row["State"] == "NSW":
Count += row["Number of teeth lost"]
若新南威尔士州包含3个值2,3,4,那个么我需要计算这三个数的平均值,以及其他六个州的平均值。我使用熊猫来操纵csv文件
Tags:
尝试使用
df.loc[df['State'] == "NSW"]['Number of tooth lost'].mean()
它选择
.loc
括号内条件为真的所有行,然后只选择列“牙齿丢失数”来计算平均值这比像您那样迭代所有行要快得多,因为pandas在较低的级别上处理操作
相关问题 更多 >
编程相关推荐