按列名和工作表名称获取列数据

2024-04-18 08:06:53 发布

您现在位置:Python中文网/ 问答频道 /正文

有没有一种方法可以使用python xlrd访问特定工作表中列中的所有行。

例如:

workbook = xlrd.open_workbook('ESC data.xlsx', on_demand=True)
sheet = workbook.sheet['sheetname']
arrayofvalues = sheet['columnname']

还是我必须自己编一本字典?

excel相当大,所以我希望避免遍历所有的colname/sheets


Tags: 方法truedata字典onopenxlsxsheet
2条回答

此脚本允许将xls文件转换为词汇列表, 列表中的所有dict表示一行

import xlrd

workbook = xlrd.open_workbook('esc_data.xlss')
workbook = xlrd.open_workbook('esc_data.xlsx', on_demand = True)
worksheet = workbook.sheet_by_index(0)
first_row = [] # Header
for col in range(worksheet.ncols):
    first_row.append( worksheet.cell_value(0,col) )
# tronsform the workbook to a list of dictionnaries
data =[]
for row in range(1, worksheet.nrows):
    elm = {}
    for col in range(worksheet.ncols):
        elm[first_row[col]]=worksheet.cell_value(row,col)
    data.append(elm)
print data

是的,您正在查找col_values()工作表方法。而不是

arrayofvalues = sheet['columnname']

你必须这么做

arrayofvalues = sheet.col_values(columnindex)

其中columnindex是列的编号(从零开始计算,因此A列是索引0,B列是索引1,等等)。如果在第一行(或前几行)中有一个描述性标题,则可以给出第二个参数,该参数指示从哪一行开始(同样,从零开始计数)。例如,如果有一个标题行,因此希望值从第二行开始,则可以

arrayofvalues = sheet.col_values(columnindex, 1)

有关xlrd包的合理可读性讨论,请查看tutorial。(官方的^{} documentation更难阅读。)

还请注意:(1)当您可以自由使用名称arrayofvalues时,实际上得到的是一个Python列表,从技术上讲,它不是一个数组;(2)当使用.xlsx文件时,on_demand工作簿参数不起作用,这意味着xlrd将尝试将整个工作簿加载到内存中,而不管怎样。(功能on_demand适用于.xls文件。)

相关问题 更多 >