伙计们,我想读取并填充excel数据的缺失值。但是我有很多表在一张表中,如何拆分它,只填充不同表的表数据值。在
我的代码是:
#read excel files
import pandas as pd
import numpy as np
stations_data = pd.read_excel('filename', sheet_name=0, skiprows=6)
#get a data frame with selected columns
FORMAT = ['S.No.', 'YEAR', 'JUNE']
df_selected = stations_data[FORMAT]
for col in FORMAT:
for idx, rows in df_selected.iterrows():
if pd.isnull(df_selected.loc[idx,col]):
df_selected = df_selected.fillna(df_selected.mean())
print (df_selected)
您可以使用
pd.read_excel
,其中使用关键字参数skiprows
从特定表的“正确”行开始,skipfooter
停止在正确的行。当然,如果将来表中的行数发生变化,这可能就不太实际了。也许更简单的方法是将excel重新构造为每张表有一个表,然后使用sheetname
kwarg。参见documentation。在相关问题 更多 >
编程相关推荐