python中基于两个文件列坐标的文件合并

chrom chromStart chromEnd name strand observed chr1 259 260 rs72477211 + A/G single chr1 433 433 rs56289060 + -/C insertion chr1 491 492 rs55998931 + C/T single chr1 518 519 rs62636508 + C/G single chr1 582 583 rs58108140 + A/G single

chrom chromStart chromEnd name strand observed tf_title tf_score chr1 259 260 rs72477211 + A/G NFKB1 123 chr1 433 433 rs56289060 + -/C IRF4 234 chr1 491 492 rs55998931 + C/T BCL3 231 chr1 518 519 rs62636508 + C/G TCF12 12 chr1 582 583 rs58108140 + A/G BAD170 89

1条回答

网友

1楼 · 发布于 2024-04-26 00:23:21

如果它适合内存，您可以使用outer方法将两个数据帧outer仅基于chrom列，然后通过执行范围包含数学来过滤结果：

df = snp.merge(gene, how='outer', on='chrom')
df = df[(df.chromStart_x>=df.chromStart_y) & (df.chromEnd_x<=df.chromEnd_y)]

最终可以删除重复列：

^{pr2}$

编程相关推荐

java具有数量可变的参数，可以同时加载数量可变的图像
java应用程序在后台运行数小时后，当对象变量被系统破坏时，如何在应用程序类中保存对象变量
Java使用不带名称空间的XSD验证XML
关于在Play 2.2.1上安装死锁的java问题
字符串中的java字符串分隔符。分裂法
菜单中的java项不显示操作栏，而是在三个点中显示，没有任何图标
以int值作为键的java HashMap
java OpenAPIgeneratorEventPlugin身份验证查询参数未发送
java如何使用用户输入停止程序
java XIMA Formcycle图像预览问题

相关问题更多 >

编程相关推荐

热门问题

热门文章