Pandas基于多列/行标准添加不同行

Fruit CurrentDate DailyFruitSpoilage 0 Apple 2018-08-29 -10 1 Apple 2018-08-30 -20 2 Apple 2018-08-31 -30 3 Apple 2018-09-01 -40 4 Orange 2018-08-29 -10 5 Orange 2018-08-30 -20 6 Orange 2018-08-31 -30 7 Orange 2018-09-01 -40

2条回答

网友

1楼 · 编辑于 2024-04-25 05:40:01

我们可以使用numpy数组进行切片和添加。假设df是变质表，df2是库存表，1050是水果的初始数量

dfj=df.join(df2.set_index(['CurrentDate','Fruit']),on=['CurrentDate','Fruit'],how='outer')
dfj=dfj.sort_values(['Fruit','CurrentDate']).reset_index(None,True)
dfj.loc[1:,'BeginningFruitInventory']=np.array(dfj.DailyEndingInventory[:-1])+np.array(dfj.DailyFruitSpoilage[1:])
dfj.BeginningFruitInventory.fillna(1050,inplace=True)
dfj

^{pr2}$

连接CurrentDate和fruit上的两个数据帧
排序和重置索引
使用np.数组（）添加每个系列的切片而不考虑索引
或者，也可以在切片后重置索引并正常添加它们。在

网友

2楼 · 编辑于 2024-04-25 05:40:01

根据你的数据：

data_1 = {'Fruit': ['Apple', 'Apple', 'Apple', 'Apple', 'Orange', 'Orange', 'Orange', 'Orange'],
        'CurrentDate': ['2018-08-29', '2018-08-30', '2018-08-31', '2018-09-01', '2018-08-29', '2018-08-30', '2018-08-31', '2018-09-01'],
        'DailyFruitSpoilage': [-10, -20, -30, -40, -10, -20, -30, -40]}

data_2 = {'Fruit': ['Apple', 'Apple', 'Apple', 'Apple', 'Orange', 'Orange', 'Orange', 'Orange'],
        'CurrentDate': ['2018-08-29', '2018-08-30', '2018-08-31', '2018-09-01', '2018-08-29', '2018-08-30', '2018-08-31', '2018-09-01'],
        'DailyEndingInventory': [1000, 900, 870, 820, 1000, 900, 820, 750]}

df_1 = pd.DataFrame(data_1)
df_2 = pd.DataFrame(data_2)

相应地转换日期并创建日期偏移：

^{pr2}$

然后合并带有滞后的数据帧：

df_3 = df_1.merge(df_2, on=['Date','Fruit'], suffixes=('','_lag'), how='right')

计算列差异，然后相应地移动：

df_3['BeginningInventory'] = df_3['DailyFruitSpoilage'] + df_3['DailyEndingInventory']

df_3.BeginningInventory = df_3.BeginningInventory.shift(+1)

然后返回一个BeginningInventory列：

Index   Fruit CurrentDate  DailyFruitSpoilage       Date CurrentDate_lag  DailyEndingInventory  BeginningInventory
0   Apple  2018-08-30               -20.0 2018-08-30      2018-08-29                  1000                 NaN
1   Apple  2018-08-31               -30.0 2018-08-31      2018-08-30                   900               980.0
2   Apple  2018-09-01               -40.0 2018-09-01      2018-08-31                   870               870.0
3  Orange  2018-08-30               -20.0 2018-08-30      2018-08-29                  1000               830.0
4  Orange  2018-08-31               -30.0 2018-08-31      2018-08-30                   900               980.0
5  Orange  2018-09-01               -40.0 2018-09-01      2018-08-31                   820               870.0
6   Apple         NaT                 NaN 2018-09-02      2018-09-01                   820               780.0
7  Orange         NaT                 NaN 2018-09-02      2018-09-01                   750                 NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas基于多列/行标准添加不同行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >