我有两个文件,我试图从文件1中提取一些值,如下所示:
File1:
2 word1
4 word2
4 word2_1
4 word2_2
8 word5
8 word5_3
File 2:
4
8
我想要的是从文件2中提取以4和8开头的每一行,它们都是很多。 所以通常如果只有一行匹配,我会使用python字典,一个键一个元素容易!但是现在我有多个元素与同一个键匹配,我的脚本只提取最后一个元素(显然,随着它的进行,它将删除之前的元素!)。 所以我知道这不是怎么回事,但我不知道,如果有人能帮我开始,我会很高兴的。在
以下是我的“常用”代码:
^{pr2}$
你考虑过使用^{} 吗。您可以将文件加载到
DataFrame
中,然后对其进行筛选:在5中是里德文件,在9中是按数字值过滤文件,在13中是将两个过滤后的文件合并在一起。
然后你就可以对它进行排序,并且比用字典计算要容易得多。在
更新} 给出它的列表或使用
^{pr2}$要根据列值在某个列表中的条件筛选
pandas.DataFrame
,可以使用^{range
。在创建字典、列表的值,并附加到它们后面。在
一般情况下:
在您的例子中,您的值是列表,因此将列表添加(连接)到字典的列表中:
^{pr2}$如果您实际想要打印的是每个基因的计数,那么将
"\t".join(count)
替换为len(count)
,即列表的长度。在相关问题 更多 >
编程相关推荐