无法用pandas解析Python 2.7中.XLSX中的字符串“N/A”

2024-03-28 23:20:14 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个很大的Excel电子表格,我正试图将其解析为Python2.7和pandas 0.19.1,以便将数据插入MySQL数据库。作为其中的一部分,某些单元格包含字符串“N/A”。不幸的是,熊猫似乎无法解析“N/A”,相反,它导入了nan。在字符串周围包含单引号或双引号时,pandas将其分别作为“N/A”和“N/A”导入,并且与我的数据不匹配。你知道吗

有没有办法在不修改现有数据的情况下读取字符串“N/A”?你知道吗

MWE如下,包括GitHub上测试数据文件的链接:

import pandas as pd
loadData = pd.ExcelFile("testData.xlsx")
testData = loadData.parse("Sheet1")

for row in testData.itertuples(index=True, name='testTuple'):     
    if getattr(row, "Value") == "N/A":
        print(row)

链接到测试数据文件:https://github.com/quacksawbones/testData/blob/master/testData.xlsx

(注:关于StackOverflow的第一个问题。如果我遗漏了什么或需要更多信息,请告诉我)


Tags: 文件数据字符串pandas链接mysqlxlsxexcel