从缺少d的excel表中删除

2024-03-29 12:52:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试连接从excel读取的许多表,并使用pandas进行数据透视(堆叠)。下面的代码工作得很好,除了final dataframe(GRL)缺少最后两列之外。这些列对应于输入excel文件中的列,这些列的第一个条目是几个空单元格。我试过在数据的子集(和测试数据)上使用concat,它似乎是有效的,但不适用于整个数据集。看来pd.concat公司在列以缺少数据开头的datetime索引上没有采用联合。你知道吗

有人能在这里发现一个明显的错误吗?谢谢。你知道吗

path = 'C:\\dr\\'
WQ_file = 'File.xlsx'

xl = pd.ExcelFile(path + WQ_file)
sheet_names = xl.sheet_names

GRL = pd.read_excel(path + WQ_file, sheetname = sheet_names[0], parse_cols = 15, index_col = 0, na_values = ['', 'na'])
GRL = GRL.stack(dropna=False).reorder_levels([1,0]).sortlevel(0)
GRL.name = sheet_names[0]

for n in sheet_names[1:-1]:
    df1 = pd.read_excel(path + WQ_file, sheetname = n, parse_cols = 15, index_col = 0, na_values = ['', 'na'])
    df1 = df1.stack(dropna=False).reorder_levels([1,0]).sortlevel(0)
    df1.name = n
    GRL = pd.concat([GRL, df1], axis = 1)
GRL.columns.name = 'Locations'
GRL

Tags: 数据pathnamereadnamesexcelwqfile