基于行和多列的数据帧列

fiscalYear ticker open 2017 FINL 17.4880 2017 AAPL 17.4880 ... 2016 FINL 16.4880 2016 AAPL 16.4880 2015 FINL 15.4880 2015 AAPL 15.4880

fiscalYear ticker open open_next_year 2017 FINL 17.4880 2017 AAPL 17.4880 2016 FINL 16.4880 17.4880 2016 AAPL 16.4880 17.4880 2015 FINL 15.4880 16.4880 2015 AAPL 15.4880 16.4880

2条回答

网友
1楼 · 编辑于 2024-06-06 15:09:26

下面是另一种先创建地图的方法
m = dict(zip(tuple(zip(df.fiscalYear - 1, df.ticker)),df.open)) df['open_next_year'] = df[['fiscalYear','ticker']].apply(tuple, 1).map(m)
地图/字典如下所示，通过将第1年、股票代码和开放值压缩在一起获得：
{(2014, 'AAPL'): 15.488, (2014, 'FINL'): 15.488, (2015, 'AAPL'): 16.488, (2015, 'FINL'): 16.488, (2016, 'AAPL'): 17.488, (2016, 'FINL'): 17.488}
完整示例：
data = '''\ fiscalYear ticker open 2017 FINL 17.488 2017 AAPL 17.488 2016 FINL 16.488 2016 AAPL 16.488 2015 FINL 15.488 2015 AAPL 15.488''' fileobj = pd.compat.StringIO(data) df = pd.read_csv(fileobj, sep='\s+') m = dict(zip(tuple(zip(df.fiscalYear - 1, df.ticker)),df.open)) df['open_next_year'] = df[['fiscalYear','ticker']].apply(tuple, 1).map(m) print(df)
返回：
fiscalYear ticker open open_next_year 0 2017 FINL 17.488 NaN 1 2017 AAPL 17.488 NaN 2 2016 FINL 16.488 17.488 3 2016 AAPL 16.488 17.488 4 2015 FINL 15.488 16.488 5 2015 AAPL 15.488 16.488

网友
2楼 · 编辑于 2024-06-06 15:09:26

我认为每个群体都需要通过^{}改变所有价值观：
df['open_next_year'] = df.groupby('ticker')['open'].shift() print (df) fiscalYear ticker open open_next_year 0 2017 FINL 17.488 NaN 1 2017 AAPL 17.488 NaN 2 2016 FINL 16.488 17.488 3 2016 AAPL 16.488 17.488 4 2015 FINL 15.488 16.488 5 2015 AAPL 15.488 16.488
更改了唯一open值的示例：
print (df) fiscalYear ticker open 0 2017 FINL 17.4881 1 2017 AAPL 17.4882 2 2016 FINL 16.4883 3 2016 AAPL 16.4884 4 2015 FINL 15.4885 5 2015 AAPL 15.4886 df['open_next_year'] = df.groupby('ticker')['open'].shift() print (df) fiscalYear ticker open open_next_year 0 2017 FINL 17.4881 NaN 1 2017 AAPL 17.4882 NaN 2 2016 FINL 16.4883 17.4881 3 2016 AAPL 16.4884 17.4882 4 2015 FINL 15.4885 16.4883 5 2015 AAPL 15.4886 16.4884

相关问题更多 >

编程相关推荐

热门问题

热门文章