我的剧本是
import sys
import pandas as pd
inputfile = sys.argv[1]
xl = pd.ExcelFile(inputfile)
# print xl.sheet_names
df = xl.parse(xl.sheet_names[0])
print df.head()
然而,这似乎并没有像它给出的那样正确地处理头文件
GCSE and IGCSE1 results2,3 in selected subjects4 of pupils at the end of key stage 4 Unnamed: 1 Unnamed: 2 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6 Unnamed: 7 Unnamed: 8 Unnamed: 9 Unnamed: 10
0 Year: 2010/11 (Final) NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
1 Coverage: England NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
2 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
3 1. Includes International GCSE, Cambridge Inte... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
4 2. Includes attempts and achievements by these... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
所有这些都应视为评论。
例如,如果将电子表格加载到libreoffice中,则可以看到列标题已正确解析,并显示在第15行中,并带有下拉菜单,以便选择所需的项。
如何让pandas像libreoffice一样自动检测列标题的位置?
pandas
是(是?)正确地处理文件,并且完全按照您的要求(他们?)到。您没有指定header
值,这意味着它默认从第0行提取列名。前几行单元格在某些基本方面不是注释,它们只是不是您感兴趣的单元格。只要告诉
parse
您想跳过一些行:相关问题 更多 >
编程相关推荐