如何在datafram中插入多行标题的excel数据

2024-05-15 22:15:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试将非结构化excel文件转换为结构化excel文件。我的标题跨越两行(1和2),用于标题SKU、Qty和sales

   A              B                  C             D
1                                    Qty          Sales 
2   SKU             
3   2345       Nail Varnish          2              $15 
4   2346       Eye liner             3              $18

一旦转换成dataframe,我想要的输出应该如下所示

    SKU           Description        Qty          Sales             
0   2345         Nail Varnish         2             $15 
1   2346         Eye liner            3            $18

我尝试在read_excel函数中传递多行作为标题

df = pd.read_excel('D:\Sales.xlsx',header=[1,2])

但我得到的结果是

    Unnamed:0_level_0  Unnamed:1_level_0         Qty               Sales  
         SKU                 SKU           Unnamed:2_level_1   Unnamed:3_level_1

  0   2345             Nail Varnish             2                      $15
  1   2346             Eyeliner                 3                      $18

头文件SKU也应用于第二列。请指导如何进行故障排除


Tags: 文件标题readlevelexcel结构化qtyeye
1条回答
网友
1楼 · 发布于 2024-05-15 22:15:57

如果您事先知道列名,那么您可以这样做

df = pd.read_excel('D:\Sales.xlsx', header=None, names=['SKU','Description','Qty','Sales'], skiprows=2)

解释

  • header=None不会从excel文件中获取默认头
  • names将按顺序为数据帧分配列名
  • skiprows将跳过excel的前两行

相关问题 更多 >