月度经常性支出的Python代码

Question

我正在尝试找出每月重复的支出，这些支出需要有相同的ID、类别和金额。而且这些支出必须至少在连续的3个月中出现。

我写的代码没有得到正确的结果。

import pandas as pd

# Updated Sample DataFrame
data = {
    'id': [1, 1, 1, 2, 2, 2, 1, 1, 2, 2,2,2],
    'date': ['2023-01-17', '2023-01-15', '2022-11-16', '2023-01-16', '2022-12-14', '2022-11-10', '2022-12-20', '2022-12-10', '2023-01-25', '2022-11-05','2022-10-05','2022-09-07'],
    'category': ['Groceries', 'Utilities', 'Groceries', 'Groceries', 'Utilities', 'Groceries', 'Groceries', 'Utilities', 'Groceries', 'Utilities','Utilities','Utilities'],
    'amount': [50, 50, 50, 60, 80, 80, 50, 55, 75, 75,75,75]
}

df = pd.DataFrame(data)
df['date'] = pd.to_datetime(df['date'])  # Convert 'date' column to datetime format

# Sort DataFrame 
df = df.sort_values(by=['id','category','amount', 'date'], ascending=[True, True,True,False])

df['recurring'] = 0

for i in range(len(df)-2):
    
    if (df.iloc[i]['id'] == df.iloc[i+1]['id'] == df.iloc[i+1]['id']) and \
    (df.iloc[i]['category'] == df.iloc[i+1]['category'] == df.iloc[i+1]['category']) and \
    df.iloc[i]['amount'] == df.iloc[i+1]['amount'] == df.iloc[i+1]['amount'] and \
    (df.iloc[i]['date'].to_period('M') - df.iloc[i-1]['date'].to_period('M')) == 1 and (df.iloc[i-1]['date'].to_period('M') - df.iloc[i-2]['date'].to_period('M')) == 1:
        df['recurring'] = 1
        
print(df)

但是我得到的结果是：所有重复支出的值都是0。我的逻辑哪里出错了呢？

 id       date   category  amount  recurring
0    1 2023-01-17  Groceries      50          0
6    1 2022-12-20  Groceries      50          0
2    1 2022-11-16  Groceries      50          0
1    1 2023-01-15  Utilities      50          0
7    1 2022-12-10  Utilities      55          0
3    2 2023-01-16  Groceries      60          0
8    2 2023-01-25  Groceries      75          0
5    2 2022-11-10  Groceries      80          0
9    2 2022-11-05  Utilities      75          0
10   2 2022-10-05  Utilities      75          0
11   2 2022-09-07  Utilities      75          0
4    2 2022-12-14  Utilities      80          0

我期望的输出是：

 id       date   category  amount  recurring
0    1 2023-01-17  Groceries      50          1
6    1 2022-12-20  Groceries      50          0
2    1 2022-11-16  Groceries      50          0
1    1 2023-01-15  Utilities      50          0
7    1 2022-12-10  Utilities      55          0
3    2 2023-01-16  Groceries      60          0
8    2 2023-01-25  Groceries      75          0
5    2 2022-11-10  Groceries      80          0
9    2 2022-11-05  Utilities      75          1
10   2 2022-10-05  Utilities      75          0
11   2 2022-09-07  Utilities      75          0
4    2 2022-12-14  Utilities      80          0

条件筛选数据分析逻辑错误重复支出月度预算

月度经常性支出的Python代码

1 个回答

撰写回答