用python和R计算大Pandas重复样本的一致率

>duplicates markerid 1A 1B 2A 2B 3A 3B rs1512 CC CC CT CC CC TT rs1779 TT TG TG TT -- TG rs12743 TT TG TG TT TT TT rs13229 CC GC CC -- CC CC rs1328 CC CC GG GG CG CG

1条回答

网友

1楼 · 发布于 2024-06-16 10:53:27

这就行了。注意，我的数据和你的不完全一样，但是1A和1B在3/5的情况下匹配，2A和2B在4/5的情况下匹配。在

markers = data.frame(
"1A" = c("CC", "TT", "TT", "CC", "CC"),
"1B" = c("CC", "TG", "TT", "CG", "CC"),
"2A" = c("CC", "TT", "TT", "CC", "CC"),
"2B" = c("CC", "TT", "TT", "CC", "CG"),
stringsAsFactors = FALSE
)
#
concordance = sapply(seq(1, ncol(markers), 2), function(c) {
  match = sum(markers[, c] == markers[, c+1]) / nrow(markers)
})
print(concordance)

输出是

^{pr2}$

这应该可以很好地概括为更大的数据集。您可能需要加入一些逻辑来测试数据帧是否有偶数个列。在

编程相关推荐

java JavaFX 11可编辑组合框引发IndexOutOfBoundsException
java选择数组中的数组元素
java我从来没有找到创建2D ArrayList的正确方法
java JPA查找orderById的顶部数据，并按字符串过滤Id
使用java在ejabberd中进行xmpp外部身份验证
从ajax调用向java传递点运算符
java如何使用ReadWriteLock
使用Spring控制器和jQueryAjax的java重定向
java使JFrame中的JPanel可滚动
java如何用多个。jar库？

相关问题更多 >

编程相关推荐

热门问题

热门文章

用python和R计算大Pandas重复样本的一致率

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >