我正在尝试将非结构化excel文件转换为结构化excel文件。我的标题跨越两行(1和2),用于标题SKU、Qty和sales
A B C D
1 Qty Sales
2 SKU
3 2345 Nail Varnish 2 $15
4 2346 Eye liner 3 $18
一旦转换成dataframe,我想要的输出应该如下所示
SKU Description Qty Sales
0 2345 Nail Varnish 2 $15
1 2346 Eye liner 3 $18
我尝试在read_excel
函数中传递多行作为标题
df = pd.read_excel('D:\Sales.xlsx',header=[1,2])
但我得到的结果是
Unnamed:0_level_0 Unnamed:1_level_0 Qty Sales
SKU SKU Unnamed:2_level_1 Unnamed:3_level_1
0 2345 Nail Varnish 2 $15
1 2346 Eyeliner 3 $18
头文件SKU
也应用于第二列。请指导如何进行故障排除
如果您事先知道列名,那么您可以这样做
解释
header=None
不会从excel文件中获取默认头names
将按顺序为数据帧分配列名skiprows
将跳过excel的前两行李>相关问题 更多 >
编程相关推荐