我知道这是一个重复的问题,但我尝试了其他问题的答案,我无法解决这个问题
总之,我想用“A”替换0,用“A B”替换1,用“B B”替换2,用“0”替换5
我的插补数据文件(datafile.txt)格式如下所示,我只想替换“Geno”列中的信息(在真正的数据集中,我有一百万行)
我使用的管道是:
import pandas as pd
#input file
fin = pd.read_table('dataframe.txt',sep = ' ', header=None)
df = pd.DataFrame(fin)
geno = (df.iloc[: , 1:])
id = (df.iloc[: , 0])
geno = pd.DataFrame(geno)
geno2 = geno.replace("0","A A ").replace("1","A B ").replace("2","B B ").replace("5","0 0 ")
我感谢你的帮助!我是在bash(使用awk)中完成的,但这需要很长时间。我决定试试Python,因为我相信它会更快。附言:我是Python的初学者。 再次感谢你
尝试:
输出:
带有
dict
的Series Replace也是一个选项:df
:相关问题 更多 >
编程相关推荐