有没有更有效的方法将10000个excel行加载到python中？

网友

1楼 · 编辑于 2024-05-29 05:50:11

您可以使用pandas将数据直接从excel加载到pandasDataFrame

import pandas as pd

df = pd.read_excel('filename')

然后可以使用pandas进行快速操作和分析。在

最后，您可以将其保存在Excel、CSV、JSON、HTML、LaTeX中，甚至可以直接保存在数据库中。在

所以也许你不需要一些“教师对象”。在

网友

2楼 · 编辑于 2024-05-29 05:50:11

另一种方法是将Excel电子表格转换为CSV格式。在

然后使用标准库中的Pythoncsv模块。在

from csv import reader as csv_reader

with open("data.csv", "r") as fd:
    for row in csv_reader(fd):
        userid, firstname, lastname = row

说明：

另请注意：如果您的数据包含Unicode字符，您将希望安装并使用Python Package Index（PyPi）中的unicodecsv第三方库。在

网友

3楼 · 编辑于 2024-05-29 05:50:11

XLRD向提供了一个row（row#）方法，该方法应该可以节省2次返回该文件的行程。在

for row in range(11) :
    userID, firstName, junk, lastName = sheet1.row_values(row, 0, 3)

在大多数情况下，您希望处理单元格上的行，从数据集中提取一个切片并处理它比每次返回数据集更有效。在

10000行太多了，所以加载它需要一段时间。您可能需要考虑像XML或JSON这样的格式，它们的库中通常有高效的搜索方法，或者像SQLite这样的平面数据库引擎。在

一旦你点击了一千多行，通常最好使用程序员友好的格式或数据库，因为这些都是为了提高效率。在

*我从上面的代码中猜到有4列，第三列被忽略，因此产生了垃圾变量。在