在每个数据帧行中查找前3个值

!curl -L -s -o open_price.csv https://drive.google.com/uc?id=1eClVnVMMgw5bIFJ8sMS8h4d5Msj5gyKo !curl -L -s -o low_price.csv https://drive.google.com/uc?id=1yRafpOnVQbCGUKq5YnIfXTZisCJQ386x !curl -L -s -o high_price.csv https://drive.google.com/uc?id=1Kpwh_EgwjpSsFXojLrPvznmyl7z9_afk !curl -L -s -o close_price.csv https://drive.google.com/uc?id=1IF96oVlbz1wOOKrcYbT7J1P6UCxVa5XI !curl -L -s -o adj_close_price.csv https://drive.google.com/uc?id=1CjlEcxZkzYrNbqNQHPwLlAEvciEmtTF2 !ls

open_price = pd.read_csv("open_price.csv") low_price = pd.read_csv("low_price.csv") high_price = pd.read_csv("high_price.csv") close_price = pd.read_csv("close_price.csv") adj_close_price = pd.read_csv("adj_close_price.csv")

open_price_melted = pd.melt(open_price,id_vars="Date",var_name="Symbol",value_name="Open") high_price_melted = pd.melt(high_price,id_vars="Date",var_name="Symbol",value_name="High") low_price_melted = pd.melt(open_price,id_vars="Date",var_name="Symbol",value_name="Low") close_price_melted = pd.melt(close_price,id_vars="Date",var_name="Symbol",value_name="Close") adj_close_price_melted = pd.melt(adj_close_price,id_vars="Date",var_name="Symbol",value_name="Adj Close") melted_df = [open_price_melted,high_price_melted.loc[:,[False,False,True]],low_price_melted.loc[:,[False,False,True]],close_price_melted.loc[:,[False,False,True]],adj_close_price_melted.loc[:,[False,False,True]]] price = pd.concat(melted_df,join="inner",axis=1)

stock = close_price stock["Month"] = close_price["Date"].apply(lambda x: x[0:7]) stock_1 = pd.melt(stock, id_vars=["Date","Month"], var_name="Symbol", value_name="Adj Close") stock_1_grp = stock_1.groupby(["Month","Symbol"]) stock_2 = stock_1_grp.agg([("", lambda x: x.iloc[len(x)-1]/x.iloc[0]-1)]) stock_2_pivot = pd.pivot_table(stock_2,values="Adj Close", index="Month", columns="Symbol") stock_2_pivot.sort_index(axis=1) stock_2_pivot.reset_index() monthly_return = stock_2_pivot.iloc[1:36,0:] monthly_return.reset_index()

1条回答

网友

1楼 · 发布于 2024-06-17 10:36:20

你必须先去掉多重索引，我想应该是这样的：

monthly_return.columns = [j for i,j in monthly_return.columns]
monthly_return.reset_index(inplace=True)

    Month   AMZN    APPL    FB  GOOG    NFLX    SBUX    TSLA
0   2015-05 0.015040    0.010314    0.002532    -0.010764   0.120335    0.033207    0.109587
1   2015-06 0.007356    -0.039145   0.068253    -0.025244   0.054445    0.026810    0.075406

处理此类数据的一种更简单的方法是长轴心、排序并取前N，因此我们将其包装到一个函数中，以防止数据帧过度填充环境。。（我不知道你有多少……）：

def topN(data,n):
    df = data.melt(id_vars='Month')
    df = df.sort_values(by='value', ascending=False)
    df = df.groupby('Month').head(n)
    return df.sort_values(['Month','value'],ascending=[True,False])

然后我们做：

topN(monthly_return,3)

    Month   variable    value
140 2015-05 NFLX    0.120335
210 2015-05 TSLA    0.109587
175 2015-05 SBUX    0.033207
211 2015-06 TSLA    0.075406
71  2015-06 FB  0.068253
141 2015-06 NFLX    0.054445
2   2015-07 AMZN    0.225794
142 2015-07 NFLX    0.220795
107 2015-07 GOOG    0.198854

相关问题更多 >

编程相关推荐

热门问题

热门文章