Pandas：如何通过插入具有空值的行来更改数据帧的结构

df = pd.DataFrame({"line1": [200, 400, 800], "line2": [400, 900, 700], "line3": [800, 700, 966], "name": ["bla", "bloo", "bloom"}) print df line1 line2 line3 name 0 200 400 800 bla 1 400 900 700 bloo 2 800 700 966 bloom

3条回答

网友

1楼 · 编辑于 2024-04-26 00:43:06

不确定这正是你想要的。根据给出的示例数据帧，您可以尝试：

df = pd.DataFrame({"line1": [200, 400, 800], "line2": [400, 900, 700], "line3": [800, 700, 966], "name": ["bla", "bloo", "bloom"]})
dftemp=pd.DataFrame(columns=df.columns)
dftemp.loc[0]=(len(df.columns)-1)*['']+['ID']
dftemp.loc[1]=(len(df.columns)-1)*['']+['name']
dfnew= dftemp.append(df,ignore_index=True)
dfnew.rename(columns={'name':'line_name'}, inplace=True)
cols = dfnew.columns.tolist()
cols = cols[-1:]+cols[:-1]
dfnew = dfnew[cols]
print(dfnew)

Output:
      line_name line1 line2 line3
0        ID                  
1      name                  
2       bla   200   400   800
3      bloo   400   900   700
4     bloom   800   700   966

网友

2楼 · 编辑于 2024-04-26 00:43:06

您可以尝试使用Setting With Enlargement解决方案：

import pandas as pd
import numpy as np

df = pd.DataFrame({"line1": [200, 400, 800],
                   "line2": [400, 900, 700], 
                   "line3": [800, 700, 966], 
                   "name": ["bla", "bloo", "bloom"]})
print df

   line1  line2  line3   name
0    200    400    800    bla
1    400    900    700   bloo
2    800    700    966  bloom
#create empty lists with last item name and ID by length of dataframe
#add to df two lines
df.loc[-1] = [np.nan for i in range(df.shape[1] - 1) ] + ['name']
df.loc[-2] = [np.nan for i in range(df.shape[1] - 1) ] + ['ID']
print df

    line1  line2  line3   name
 0    200    400    800    bla
 1    400    900    700   bloo
 2    800    700    966  bloom
-1    NaN    NaN    NaN   name
-2    NaN    NaN    NaN     ID

#sort and reset index, rename column and fill nan to empty string
df = df.sort_index().reset_index(drop=True).rename(columns={'name':'line_name'}).fillna('')
#reorder columns
df = df[['line_name','line1','line2','line3']]

print df

  line_name line1 line2 line3
0        ID                  
1      name                  
2       bla   200   400   800
3      bloo   400   900   700
4     bloom   800   700   966

网友

3楼 · 编辑于 2024-04-26 00:43:06

df = pd.DataFrame({"line1": [200, 400, 800], "line2": [400, 900, 700], "line3": [800, 700, 966], "name": ["bla", "bloo", "bloom"]}) df.loc[-1] = [np.nan for i in range(df.shape[1] - 1) ] + ['name'] df.loc[-2] = [np.nan for i in range(df.shape[1] -1)] + ['ID'] df = df.fillna('') df=df.sort_index() df=df.reset_index() df.loc[:,['name','line1','line2','line3']]

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：如何通过插入具有空值的行来更改数据帧的结构

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >