我有一个表格文件,如下所示:
query_name KEGG_KOs
PROKKA_00013 NaN
PROKKA_00015 bactNOG[38]
PROKKA_00017 NA|NA|NA
PROKKA_00019 K00240
PROKKA_00020 K00246
PROKKA_00022 K02887
如果第2列(“KEGG_KOs”)不是以“K0”开头,我将尝试创建一个脚本来遍历并删除整行。我正在尝试创建以下输出:
query_name KEGG_KOs
PROKKA_00019 K00240
PROKKA_00020 K00246
PROKKA_00022 K02887
以前的回复提到人们使用熊猫数据框,但我没有运气使用这些回复来帮助他们。任何人都将不胜感激,干杯
我试过了(但这只隔离了一个特定的K0线)
df = pd.read_csv("eggnog.txt", delimiter="\t", names=["#query_name", "KEGG_KOs"])
print(df.loc[df['KEGG_KOs'] == 'K00240'])
您可以使用open as read,然后使用write。假设原始文件保存为old.txt,更新后的文件将保存为new.txt
使用^{} 和^{} 或^{} 和
regex
作为字符串^
和参数na=False
的开头,因为缺少值:或:
相关问题 更多 >
编程相关推荐