我的目标是传递.xlsx文件并将其转换为.csv,然后解析以删除.csv中的特殊字符,“NaN”应该显示在空单元格中。为此,我使用下面的代码。你知道吗
如果我在控制台上运行下面的命令,后跟#df,它会在输出中显示NaN。另一方面,如果我运行代码,不捕获.csv中的“NaN”吗?你知道吗
df = pd.read_excel('C:\\Users\\1480587\\Documents\\Chander\\Elastic\\Data\\Dec_Inc_Data.xlsx')
使用下面版本的Python和Pandas。你知道吗
INSTALLED VERSIONS
------------------
commit: None
python: 2.7.11.final.0
python-bits: 64
OS: Windows
OS-release: 10
pandas: 0.17.1
nose: 1.3.7
pip: 8.0.2
import pandas as pd
df = pd.read_excel('C:\\Users\\1480587\\Documents\\Chander\\Elastic\\Data\\Dec_Inc_Data.xlsx')
df.to_csv('C:\\Users\\1480587\\Documents\\Chander\\Elastic\\Data\\Dec_Inc_Data3.csv')
是的,你可以转换np.nan公司在数据框中输入“NaN”。但是更好更快的方法是在读取excel文件时给pandas一个合适的参数,指定哪些值应该映射到nan,哪些不应该。你知道吗
调用read\u excel函数时,使用的是
na_values
参数的默认值。根据document,它将值["", "#N/A", "#N/A N/A", "#NA", "-1.#IND", "-1.#QNAN", "-NaN", "-nan", "1.#IND", "1.#QNAN", "N/A", "NA", "NULL", "NaN", "n/a", "nan", "null"]
转换为np.nan公司. 因此,您可以传入自己的nau值列表,其中不包含字符串“NaN”,然后您将在数据帧中看到字符串“NaN”。你知道吗相关问题 更多 >
编程相关推荐