NumPy直方图-值错误范围参数必须是有限的-输入数组正常

2024-04-25 21:02:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我很难理解这个错误,因为我会给你一个有效的例子,我感兴趣的是而不是

我必须分析一组包含全年小时价格的数据,称为sys_prices,经过各种转换后,它是一个有8785行(1列)的numpy.ndarray对象,每一行都是一个只有一个元素、一个numpy.float64数字的numpy.ndarray项。

以下代码不起作用:

stop_day = 95
start_day = stop_day - 10 # 10 days before
stop_day = (stop_day-1)*24
start_day = (start_day-1)*24

pcs=[] # list of prices to analyse
for ii in range(start_day, stop_day):
    pcs.append(sys_prices[ii][0])

p, x = np.histogram(pcs, bins='fd') 

*24部分是调整数据集中的索引,以便尊重每小时的分辨率。

我希望为histogram方法提供listpcs,以便将直方图和bin边的值分别转换为px

我之所以这么说是因为下面的代码可以工作:

start_day = 1 
start_month = 1 
start_year = 2016 
stop_day = 1
stop_month = 2 
stop_year = 2016
num_prices = (date(stop_year, stop_month, stop_day) - date(start_year, start_month, start_day)).days*24

jan_prices = []
for ii in range(num_prices):
    jan_prices.append(sys_prices[ii][0])

p, x = np.histogram(jan_prices, bins='fd') # bin the data`

这些代码的不同之处在于,工作示例在从一年中选定的日期开始的任意时间段内仅分析10天,而工作示例使用1月份的所有价格(例如,数据集的前744个值)。

奇怪(r)的事情:我对stop_day使用了不同的值,似乎95会引起错误,而99、100或200不会

你能帮我吗?


Tags: 数据代码numpy错误sysyearstartjan
2条回答

出现此问题的原因是,默认情况下,直方图使用min(pcs)和max(pcs)来确定存储箱的最小和最大范围,但由于数据集中有nans,因此min和max变为nans。可以通过对range参数使用np.nanminnp.nanmax来解决此问题。

p, x = np.histogram(pcs, range=(np.nanmin(pcs), np.nanmax(pcs)) bins='fd')

我认为这比公认的答案好,因为它不需要修改个人电脑

我解决了这个问题,数据集中只有一个NaN,我无法识别。

对于那些想知道如何找到它的人,我只是使用以下代码来查找项的索引:

nanlist=[]
for ii in range(len(array)):
    if numpy.isnan(array[ii]):
        nanlist.append(ii)

其中array是您的容器。

相关问题 更多 >

    热门问题