基于条件的数据帧排序和动态分配随机向量返回所有组

3条回答

网友

1楼 · 编辑于 2024-04-19 21:33:00

我不确定你是否需要一次完成所有的输出。但这里有一个可能会有帮助的想法。我使用dplyr包来完成这个。因此，首先让我重新创建您作为输入提供的数据集：

library(dplyr)
DF <- data.frame(INPUT = c(4000,4000,2000,3000,2000,2000,2000), group = c(1,1,2,3,4,4,4))
df <- tbl_df(DF)
df

输出

^{pr2}$

现在我将创建一个辅助表，它将告诉我每个组有多少行，这个表已经从max到min排序：

aux <- df %>% group_by(group) %>% summarise(n = n()) %>% arrange(-n)
aux

输出

  group     n
  (dbl) (int)
1     4     3
2     1     2
3     2     1
4     3     1

我们看到第4组出现了3次，第1组出现了两次，依此类推。现在我可以轻松地从max到min“提取”我想要的组：

ymax <- df %>% filter(group == aux$group[1])
y2 <- df %>% filter(group == aux$group[2])
y3 <- df %>% filter(group == aux$group[3])
ymin <- df %>% filter(group == aux$group[4])

输出

ymax
  INPUT group
  (dbl) (dbl)
1  2000     4
2  2000     4  
3  2000     4  

y2
  INPUT group
  (dbl) (dbl)
1  4000     1
2  4000     1  

y3
  INPUT group
  (dbl) (dbl)
1  2000     2  

ymin
  INPUT group
  (dbl) (dbl)
1  3000     3

我希望这有帮助。
我只想补充一点，你可以一次得到所有的东西当然：

ylist <- lapply(1:nrow(aux), function(x) {filter(df, group == aux$group[x])})

输出

[[1]]
Source: local data frame [3 x 2]

  INPUT group
  (dbl) (dbl)
1  2000     4
2  2000     4
3  2000     4

[[2]]
Source: local data frame [2 x 2]

  INPUT group
  (dbl) (dbl)
1  4000     1
2  4000     1

[[3]]
Source: local data frame [1 x 2]

  INPUT group
  (dbl) (dbl)
1  2000     2

[[4]]
Source: local data frame [1 x 2]

  INPUT group
  (dbl) (dbl)
1  3000     3

网友

2楼 · 编辑于 2024-04-19 21:33:00

印度先生-试试这个。在

library(sqldf)
Input=c('4000','4000','2000','3000','2000','2000','2000')   
gr<-c('1','1','2','3','4','4','4')
DF<-data.frame(Input,gr)
NewDF<-data.frame()
DF<-sqldf("select  distinct Input, gr, count(*) as C from DF group by Input, gr order by C desc")
for (i in 1:nrow(DF))
  assign(paste("NewDF_",i,sep=""),na.omit(DF[i,][rep(row.names(DF), DF$C), 1:2]))

这将使用您所需的输出创建4个不同的数据帧。在

网友

3楼 · 编辑于 2024-04-19 21:33:00

在Python Pandas中，可以执行以下操作：

创建DF：

import pandas as pd
df = pd.DataFrame()
df['INPUT'] = [4000,4000,2000,3000,2000,2000,2000]
df['group'] = [1,1,2,3,4,4,4]

按组分组并获取每个组的大小，将此大小作为一列添加到DF中并按升序排序：

^{pr2}$

然后，循环查看DF，每次都能得到所需的零件：

for i,x in enumerate(df['group'].unique()):
print 'ouput',i
print df[df['group']==x].ix[:,:-1].reset_index(drop=True)
print

这将为您提供以下信息：

    ouput 0
    INPUT  group
0   2000      4
1   2000      4
2   2000      4

    ouput 1
    INPUT  group
0   4000      1
1   4000      1

    ouput 2
    INPUT  group
0   2000      2

    ouput 3
    INPUT  group
0   3000      3

输出

输出

输出

输出

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于条件的数据帧排序和动态分配随机向量返回所有组

输出

输出

输出

输出

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >