我想遍历一个目录,找到特定的xlsx文件,然后将它们分别放入单独的pandas数据帧中。这里的问题是,我还希望那些excel文件中的所有工作表都在数据框中。在
下面是我实现的代码示例,我只需要添加逻辑来选择所有工作表:
import pandas as pd
from glob import glob
path = 'path_to_file'
files = glob(path + '/*file*.xlsx')
get_df = lambda f: pd.read_excel(f)
dodf = {f: get_df(f) for f in files}
dodf[files[2]] --- dictionary of dataframes
如Pandas中的this answer所述,您仍然可以访问
ExcelFile
类,该类加载创建对象的文件。在此对象有一个
.sheet_names
属性,该属性提供当前文件中的工作表名称列表。在要实际处理特定工作表的导入,请在导入的Excel文件的对象上使用
^{pr2}$.parse(sheet_name)
:对于您的代码,例如:
…给您
dodf
一个ExcelFile
对象的字典。在相关问题 更多 >
编程相关推荐