连接数据帧中的行并基于i删除行

Column_A | Column_B | Column_C ---------|----------|--------- 1 | A | ABCD 1 | B | ABCD 1 | C | ABCD 1 | D | ABCD 2 | B | BCDX 2 | C | BCDX 2 | D | BCDX 2 | X | BCDX 3 | A | ABCD 3 | B | ABCD 3 | C | ABCD 3 | D | ABCD

Column_A | Column_B | Column_C ---------|----------|--------- 1 | A | ABCD 1 | B | ABCD 1 | C | ABCD 1 | D | ABCD 2 | B | ABCD 2 | C | ABCD 2 | D | ABCD 2 | X | 3 | A | ABCD 3 | B | ABCD 3 | C | ABCD 3 | D | ABCD

Column_A | Column_B | Column_C ---------|----------|----------- 1 | A | ABCD 1 | B | ABCD 1 | C | ABCD 1 | D | ABCD 2 | B | ABCD 2 | C | ABCD 2 | D | ABCD 2 | X | X 3 | A | ABCD 3 | B | ABCD 3 | C | ABCD 3 | D | ABCD

1条回答

网友

1楼 · 发布于 2024-04-25 09:15:06

一种方法是使用tidyverse，用唯一组的max替换所有的Column_C，确定哪些Column_B包含在Column_C（使用grepl）中，并用“X”替换那些不包含的，即

library(tidyverse)

df %>% 
 group_by(Column_C) %>% 
 mutate(new = n_distinct(Column_A)) %>% 
 ungroup() %>% 
 mutate(Column_C = Column_C[max(new)]) %>% 
 rowwise() %>% 
 mutate(Column_C = replace(Column_C, !grepl(Column_B, Column_C), 'X')) %>% 
 select(-new)

Source: local data frame [12 x 3]
Groups: <by row>

# A tibble: 12 x 3
#   Column_A Column_B Column_C
#      <int>    <chr>    <chr>
# 1        1        A     ABCD
# 2        1        B     ABCD
# 3        1        C     ABCD
# 4        1        D     ABCD
# 5        2        B     ABCD
# 6        2        C     ABCD
# 7        2        D     ABCD
# 8        2        X        X
# 9        3        A     ABCD
#10        3        B     ABCD
#11        3        C     ABCD
#12        3        D     ABCD

我确信，如果我们将带有map*函数的rowwise()操作从purrr切换到rowwise()操作，这会更有效，但我目前还不能做到。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章