两个数据帧之间的多个条件

if( cola=0 and colb=0): score = MinorAlleFrequency* effectSize (from datafram Diseases of matched row) if( cola=0 and colb=1) or (cola=1 and colb=1): score = (1 - MinorAlleFrequency)* effectSize (from datafram Diseases of matched row) if( cola=1 and colb=0): print("genotype unavailable")

2条回答

网友

1楼 · 编辑于 2024-06-02 05:55:46

首先，您可以合并您的数据帧，这样您就可以得到一个新的数据帧，其中包含两个数据帧中的列，并且只保留Diseases数据帧（列SNP）中存在的IndividualSNPs数据帧（列SNP）中的行。就像：

import pandas as pd

new_df = pd.merge(diseases_df, individual_snp_df, on="SNP", how="inner")

然后，由于您没有那么多条件，您可以：

indexes = new_df[(new_df["cola"] == 0) & (new_df["colb"] == 0)]
new_df["score"].loc[indexes] = new_df["MinorAlleFrequency"] * new_df["EffectSize"]

并用您的变体重复它（我猜您的第二个条件可以恢复为colb == 1）：

indexes = new_df[new_df["colb"] == 1]
new_df["score"].loc[indexes] = (1 - new_df["MinorAlleFrequency"]) * new_df["EffectSize"]

最后，使用NA将其余部分清空可能是比将字符串（“genetic unavailable”）放入浮点列更好的解决方案

网友

2楼 · 编辑于 2024-06-02 05:55:46

newDf = IndividualSNPs[Diseases["SNP"] == IdividualSNPs["SNP"]][["cola","colb"]]

score = np.where(((newDf["cola"] == 0) & (newDf["colb'] == 0)), (Diseases["MinorAlleFrequency"])*(Diseases["EffectSize"]), np.where(((newDf["cola"] == 0)&(newDf["colb"] == 1)) | ((newDf["cola"] == 1) & (newDf["colb"] == 1)), (1 - Diseases["MinorAlleFrequency"]) * (Diseases["EffectSize"]),print("genotype unavaible")))

相关问题更多 >

编程相关推荐

热门问题

热门文章