包含fi的数量

2024-03-29 10:32:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下代码

raw_data = pd.read_csv(r'mypath')

illnesses = pd.DataFrame(columns=['Finding_Label', 'Count_of_Patientes_Having'])
index = 0


for row_index, row in raw_data.iterrows():
    for i in row["Finding Labels"].split("|"):
        if (illnesses[illnesses["Finding_Label"].str.contains(i)]).empty:
            illnesses.at[index, 'Finding_Label'] = i
            illnesses.at[index, "Count_of_Patientes_Having"] = raw_data[raw_data["Finding Labels"].str.contains(i)].size
            index = index + 1

我需要找到包含给定字符串的行数。上面的代码给出了荒谬的数字。如何为给定任务调整此代码?你知道吗


Tags: of代码infordataindexrawcount
1条回答
网友
1楼 · 发布于 2024-03-29 10:32:25

没有数据样本确实很难,但从描述中可以计算出特定列包含给定字符串的行数?。你知道吗

如果是这样,为什么不使用DataFrame列的.str.功能呢?你知道吗


data = pd.DataFrame({
   "Finding_Label": ["A|B", "C|D"]*1000 # 2000 rows in totalonly half of the rows here contain "A"
   })


data["Finding_Label"].str.contains("A").sum()

# or

len(data[data["Finding_Label"].str.contains("A")]) => 1000

# or

data[data["Finding_Label"].str.contains("A")].count()

它可能不是你所需要的,但它可能会得到你开始。有一个小样本的数据将有助于给出一个更好的答案。你知道吗

相关问题 更多 >