Pandas数据帧条件字符串spli

2024-05-23 16:10:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我的数据框中有一列流感病毒名称。以下是当前名称格式的代表性示例:

  1. (A/Egypt/84/2001(H1N2))
  2. A/巴西/1759/2004(H3N2)
  3. A/阿根廷/126/2004

我只想从菌株名称中找出A/COUNTRY/NUMBER/YEAR,例如A/Brazil/1759/2004。我尝试过:

df['Strain Name'] = df['Original Name'].str.split("(")

但是,如果我尝试访问.str[0],那么我就错过了案例1。如果我做了.str[1],我就错过了案例2和3。在

是否有一种解决方案可以同时适用于这三种情况?或者有什么方法可以在字符串拆分中应用条件,而不必迭代数据帧中的每一行?在


Tags: 数据name名称示例df格式country案例
1条回答
网友
1楼 · 发布于 2024-05-23 16:10:06

所以,根据埃德丘姆的建议,我将在这里发表我的答案。在

解决此问题所需的最小数据帧:

^{1}$

仅获取菌株名称的代码,括号内没有括号或任何其他内容:

^{pr2}$

这段代码适用于这里拼写的特定情况,因为诀窍是,隔离的“应变名称”是被左括号(“(”)值拆分后最长的字符串。在

相关问题 更多 >