Pandas数据帧条件字符串spli

2024-05-23 16:10:06 发布

男 | 程序猿一只，喜欢编程写python代码。

我的数据框中有一列流感病毒名称。以下是当前名称格式的代表性示例：

我只想从菌株名称中找出A/COUNTRY/NUMBER/YEAR，例如A/Brazil/1759/2004。我尝试过：

df['Strain Name'] = df['Original Name'].str.split("(")

但是，如果我尝试访问.str[0]，那么我就错过了案例1。如果我做了.str[1]，我就错过了案例2和3。在

是否有一种解决方案可以同时适用于这三种情况？或者有什么方法可以在字符串拆分中应用条件，而不必迭代数据帧中的每一行？在

Tags：数据 name 名称示例 df 格式 country 案例

1条回答

网友

1楼 · 发布于 2024-05-23 16:10:06

所以，根据埃德丘姆的建议，我将在这里发表我的答案。在

解决此问题所需的最小数据帧：

^{1}$

仅获取菌株名称的代码，括号内没有括号或任何其他内容：

^{pr2}$

这段代码适用于这里拼写的特定情况，因为诀窍是，隔离的“应变名称”是被左括号（“(”）值拆分后最长的字符串。在