使用Pandas从另一个数据帧中的信息过滤一个数据帧

df = pd.DataFrame(columns=['Chromosome', 'Start','End'], data=[ ['chr1', 2000, 3000], ['chr1', 500, 1500], ['chr3', 3000, 4000], ['chr5', 4000, 5000], ['chr17', 9000, 10000], ['chr19', 1500, 2500] ])

all_indexes = [] # fake2.tsv is the aforementioned probes dataframe with open('fake2.tsv') as f: for x in f: probe, chrom, pos = x.rstrip("\n").split("\t") row = df[(df['Chromosome'] == chrom) & ((int(pos) > df['Start']) & (int(pos) < df['End']))] all_indexes.append(t.index.tolist()) all_t = [y for x in all_t for y in x] df.iloc[all_indexes]

2条回答

网友

1楼 · 编辑于 2024-05-12 19:52:59

你可以试试这个：

df.merge(probes, left_on='Chromosome', right_on='Chrom').query('Start < Position < End')

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-05-12 19:52:59

我也遇到了同样的问题，显然熊猫身上没有现成的解决办法。但是，您可以在以下线程上使用解决方案：

Best way to join/merge by range in pandas
how to perform an inner or outer join of DataFrames with Pandas on non-simplistic criterion

编程相关推荐

java Hibernate：合并并删除，而不是从数据库中删除实体对象
java如何在WebFilter中有条件地从Mono返回？
java调用mysql c3p0函数
可执行jar Java jar文件加载错误：无法找到或加载主类。类导致的错误：java。lang.ClassNotFoundException:某些东西。班
java如何减少/更改爬网后的延迟？
从其他语言（如Java、PHP、Perl、Python等）调用C/C++代码的最佳方式是什么？
java如何模拟影响对象的void返回方法
当我试图在ubuntu上启动JavaScala时，它抛出了一个异常
java如何正确输出游戏
理解java和C++背景下的JavaScript原型

相关问题更多 >

编程相关推荐

热门问题

热门文章