我有一个数据框df,我希望在我的列中用特定的值分隔来显示第一个单词和数字以及它的'T'值。我想要第一个用“-”分隔的'word',以及它的#T值。除了“Azure”大小写之外,第一个单词用“"”分隔。
这是一个棘手的问题,因为一些#T值用“-”分隔,而另一些则用“-”分隔 '.' 例如,其中一个值中的-12T,以及另一个值中的\u 14T 我想在type列中保留原始值
data = {'type': ['Azure_Standard_E64is_v4_SPECIAL_DB-A.0', 'Azure_Standard_E64is_v4_SPECIAL_DB-A.0', 'Hello-HEL-HE-A6123-123A-12T_TYPE-v.A', 'Hello-HEL-HE-A6123-123A-12T_TYPE-v.E', 'Hello-HEL-HE-A6123-123A-50T_TYPE-v.C', 'Hello-HEL-HE-A6123-123A-50T_TYPE-v.A', 'Happy-HAP-HA-R650-570A-90T_version-v.A', 'Kind-KIN-KI-T490-NET_14T-A.0', 'Kind-KIN-KI-T490-NET_14T-A.0', 'AY14.5-fyy-FY-R770-256G-6.4T-R1-v.A', 'AY14.5-fyy-FY-R770-256G-6.4T-R1-v.A'], 'free': [6, 5, 10, 5, 1, 2, 10, 7, 6, 3, 0], 'use': [1, 1, 10, 1, 4, 1, 0, 4, 3, 0, 20], 'total': [7, 6, 20, 6, 5, 1, 10, 3, 2, 3, 20]}
df = pd.DataFrame(data)
type free use total
0 Azure_Standard_E64is_v4_SPECIAL_DB-A.0 6 1 7
1 Azure_Standard_E64is_v4_SPECIAL_DB-A.0 5 1 6
2 Hello-HEL-HE-A6123-123A-12T_TYPE-v.A 10 10 20
3 Hello-HEL-HE-A6123-123A-12T_TYPE-v.E 5 1 6
4 Hello-HEL-HE-A6123-123A-50T_TYPE-v.C 1 4 5
5 Hello-HEL-HE-A6123-123A-50T_TYPE-v.A 2 1 1
6 Happy-HAP-HA-R650-570A-90T_version-v.A 10 0 10
7 Kind-KIN-KI-T490-NET_14T-A.0 7 4 3
8 Kind-KIN-KI-T490-NET_14T-A.0 6 3 2
9 AY14.5-fyy-FY-R770-256G-6.4T-R1-v.A 3 0 3
10 AY14.5-fyy-FY-R770-256G-6.4T-R1-v.A 0 20 20
所需:
Name type free use total
Azure_Standard_E64is_v4_SPECIAL_DB-A.0 Azure 6 1 7
Azure_Standard_E64is_v4_SPECIAL_DB-A.0 Azure 5 1 6
Hello-HEL-HE-A6123-123A-12T_TYPE-v.A Hello 12T 10 10 20
Hello-HEL-HE-A6123-123A-12T_TYPE-v.E Hello 12T 5 1 6
Hello-HEL-HE-A6123-123A-50T_TYPE-v.C Hello 50T 1 4 5
Hello-HEL-HE-A6123-123A-50T_TYPE-v.A Hello 50T 2 1 1
Happy-HAP-HA-R650-570A-90T_version-v.A Happy 90T 10 0 10
Kind-KIN-KI-T490-NET_14T-A.0 Kind 14T 7 4 3
Kind-KIN-KI-T490-NET_14T-A.0 Kind 14T 6 3 2
AY14.5-fyy-FY-R770-256G-6.4T-R1-v.A AY14.5 6.4T 3 0 3
AY14.5-fyy-FY-R770-256G-6.4T-R1-v.A AY14.5 6.4T 0 20 20
正在做:
df['type']= df['type'].str.extract(r'(^\w+.\d|^\w+)')+' '+df['type'].str.extract(r'(\d.\d+T|\d+T)')
这在下面起作用,但是,“AZURE”值会消失,并且原始值不会保持。 我仍在研究这一点,任何援助是感激的
您可以将^{} 与^{} 一起使用,最后添加^{} ,也可以将} 中,用于
expand=False
添加到^{Series
对于第二个位置的新列,使用^{}
感谢@Trenton McKinney提供另一种解决方案-拆分值并获取列表的第一个值:
相关问题 更多 >
编程相关推荐