从第5行开始将excel读取到python数据框,包括标题

2024-04-18 23:55:25 发布

您现在位置:Python中文网/ 问答频道 /正文

如何在python中将excel数据导入到数据框中

基本上,当前的excel工作簿在打开时运行一些vba,刷新数据透视表并执行一些其他操作

然后,我希望将数据透视表刷新的结果导入python中的数据帧中,以便进一步分析

import xlrd

wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

#sheetnames
print wb.sheet_names()

#number of sheets
print wb.nsheets

文件的刷新和打开工作正常。但是我如何从第一张表中选择数据,比如从第5行(包括标题)到最后一条记录n


Tags: 数据importopenmachinevbaexcelusers中将
2条回答

您可以使用pandas的Excel文件^{}方法读取Excel工作表,请参见io docs

xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])

skiprows将忽略前4行(即从行索引4开始)和几个other options

接受的答案是旧的(如接受答案的评论中所述)。 现在首选的选项是使用pd.read_excel()。例如:

df = pandas.read_excel('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm'), skiprows=[0,1,2,3,4])

相关问题 更多 >