高效地逐行读取Excel文件

2024-05-15 01:16:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试处理一个包含~600k行~10列的excel文件

我想逐行(或逐行)执行一些程序,就像它是一个迭代器一样(比如txt/csv文件)。但是,如果我使用xlrdpandas读取excel文件,则需要大约2-3分钟才能打开该文件

我想知道是否有可能逐行高效地读取excel文件,例如,我可以用前10行验证我的程序,而无需等待很长时间进行每次尝试

编辑:感谢您建议在处理之前将excel文件转换为csv。但是,我必须为用户创建一个一键式程序。因此,如果可能的话,我仍然希望找到一种直接高效地读取excel文件的方法


Tags: 文件csv方法用户程序txt编辑pandas
2条回答

pandasread_excel有一个nrows参数,用于控制要读取的行数。 pd.read_excel(your_xslx_file.xlsx, nrows=10)

您可以读取所需的行数,如果需要它来开始进一步读取文件,可以使用参数skiprows控制

Excel文件都是zip文件夹,每个工作表都有xml文件,打开这个文件并使用xml库读取行可能更有效

相关问题 更多 >

    热门问题