在numpy/pandas中隐藏nan事件间隔的优雅方式

a_mod = a.copy() a_mod[np.isnan(a)] = -1e9 # some value I know is larger than my interval will ever be a_sum = np.cumsum(a_mod) a_sum_pts = a_sum[a == 1] mask = np.diff(a_sum_pts) > 0 events = np.where(a == 1)[0] intervals = np.diff(events) good_intervals = intervals[mask]

2条回答

网友

1楼 · 编辑于 2024-04-26 00:34:48

试着简单一点

idx, = np.where(a==1)
nanidx, = np.where(np.isnan(a))

intervals = np.diff(idx)
good_intervals = np.delete(intervals, np.searchsorted(idx, nanidx)-1)

这只是查找1的位置和nan的位置，然后删除包含nan的间隔。你知道吗

searchsorted上的-1说明了np.diff的移位；作为一个小警告，如果在第一个1之前有nan，则此代码不能正常工作（尽管这很容易纠正）。你知道吗

网友

2楼 · 编辑于 2024-04-26 00:34:48

您可以使用^{}找出哪些片段包含nan，并将其屏蔽：

>>> idx, = np.where(a == 1)
>>> mask = np.logical_or.reduceat(np.isnan(a), idx)[:-1]
>>> np.diff(idx)[~mask]
array([4, 5])

这将线性执行，即O(n)。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章