我在熊猫中有一个数据框架,它是这样组织的:
btc_price['btc_price'] = pd.to_numeric(btc_price['btc_price'].str.replace(',', ''))
btc_price.head(n=120)
Out[4]:
btc_price
time
2017-08-27 22:50:00 4,389.6113
2017-08-27 22:51:00 4,389.0850
2017-08-27 22:52:00 4,388.8625
2017-08-27 22:53:00 4,389.7888
2017-08-27 22:56:00 4,389.9138
2017-08-27 22:57:00 4,390.1663
2017-08-27 22:58:00 4,390.2600
2017-08-27 22:59:00 4,392.4013
2017-08-27 23:00:00 4,391.6588
2017-08-27 23:01:00 4,391.9213
2017-08-27 23:02:00 4,394.0113
2017-08-27 23:03:00 4,396.9713
2017-08-27 23:04:00 4,397.3350
2017-08-27 23:05:00 4,397.0700
2017-08-27 23:06:00 4,398.6188
2017-08-27 23:07:00 4,398.5725
2017-08-27 23:08:00 4,397.4713
2017-08-27 23:09:00 4,398.0938
2017-08-27 23:10:00 4,398.7775
2017-08-27 23:11:00 4,398.0200
2017-08-27 23:12:00 4,397.9513
2017-08-27 23:13:00 4,398.0613
2017-08-27 23:14:00 4,398.0900
2017-08-27 23:15:00 4,398.0063
2017-08-27 23:16:00 4,397.6088
2017-08-27 23:17:00 4,394.3763
2017-08-27 23:46:00 4,389.1100
2017-08-27 23:48:00 4,390.6763
2017-08-27 23:49:00 4,392.5388
2017-08-27 23:49:00 4,392.5388
...
2017-08-28 00:51:00 4,367.5738
2017-08-28 00:51:00 4,367.5738
2017-08-28 00:52:00 4,367.7888
2017-08-28 00:53:00 4,368.4188
2017-08-28 00:54:00 4,368.8225
2017-08-28 00:55:00 4,368.7438
2017-08-28 00:57:00 4,368.4700
2017-08-28 00:58:00 4,367.9963
2017-08-28 00:59:00 4,366.4750
2017-08-28 01:00:00 4,359.1988
2017-08-28 01:01:00 4,355.2825
2017-08-28 01:02:00 4,352.3675
2017-08-28 01:03:00 4,354.2188
2017-08-28 01:04:00 4,353.5263
2017-08-28 01:05:00 4,354.2488
2017-08-28 01:06:00 4,358.8063
2017-08-28 01:07:00 4,359.5738
2017-08-28 01:08:00 4,361.7313
2017-08-28 01:09:00 4,360.8638
2017-08-28 01:10:00 4,363.0750
2017-08-28 01:11:00 4,362.3375
2017-08-28 01:12:00 4,362.3338
2017-08-28 01:13:00 4,358.8000
2017-08-28 01:14:00 4,354.0463
2017-08-28 01:15:00 4,356.1950
2017-08-28 01:16:00 4,359.5975
2017-08-28 01:17:00 4,360.1588
2017-08-28 01:18:00 4,362.2338
2017-08-28 01:19:00 4,363.7900
2017-08-28 01:20:00 4,362.6150
我想创建一个值为-1,0,1的新列change
。这应与过去一小时内价格下降5%(-1)、“不变”(0)和过去一小时(1)价格上涨5%相对应。另外,一小时的值应该是可变的,所以我可以将其更改为一天或30分钟,这是我认为合适的。在
我发现了类似的问题here和here,但我对python不太熟悉,不知道如何将这些解决方案具体应用于我的问题。在
另一种选择是计算每小时的平均价格,然后计算每小时的百分比变化,但我更希望能够使用滚动时间框架。在
我也试过在R做这个,但没有运气。请帮忙。在
我开始尝试:
^{pr2}$这是可行的,但不能给我我想要的,我想比较每个值与过去“时间范围”的最小值和最大值,并根据这个值计算百分比变化,而不是简单地比较两行。在
我最后想说的是这样(不完整):
# Calculate the % change in btc_price
def calc_change(df):
array = df.values
a = array[:,1]
# Apply % change comparison to timeframe
def rolling(df, period, func, min_periods = None):
if min_periods is None:
min_periods = period
result = pd.Series(np.nan, index = df.index)
for i in range(1, len(df) + 1):
sub_df = df.iloc[max(i)]
我相信我可以使用df.rolling()
foundhere之类的东西,但不太确定这是否正是我想要的,因为我不太明白它是如何工作的。解释一下就好了。在
pd.read_clipboard
导入它pd.to_numeric
进行转换。在获得有效数据后,可以执行以下操作:
感觉你需要:
Resample
以获得可预测的分辨率FFill
以便没有孔。或者用其他对你来说有意义的方式来处理。在pct_change
。在pd.cut
。同样,简单的df['change'].map(lamba v: # here logic)
也可以。在相关问题 更多 >
编程相关推荐