假设我们有一个包含变量分组及其频率的表:
在R中:
> df
# A tibble: 3 x 3
Cough Fever cases
<lgl> <lgl> <dbl>
1 TRUE FALSE 1
2 FALSE FALSE 2
3 TRUE TRUE 3
然后,我们可以使用tidyr::uncount
获得一个包含各个案例的数据帧:
> uncount(df, cases)
# A tibble: 6 x 2
Cough Fever
<lgl> <lgl>
1 TRUE FALSE
2 FALSE FALSE
3 FALSE FALSE
4 TRUE TRUE
5 TRUE TRUE
6 TRUE TRUE
Python/Pandas中是否有一个等价物
我还没有在Python中找到一个等价的函数,但这是可行的
df['cases']
被传递给df2
,然后您创建一个新的数据帧,根据df2
中的计数重复原始数据帧中的元素。如果有帮助,请告诉我您有一个行索引,并根据计数重复它,例如在R中,您可以执行以下操作:
首先要获得像您这样的数据:
然后:
除了其他解决方案之外,您还可以组合
take
、repeat
和drop
:相关问题 更多 >
编程相关推荐