下面是一个包含示例数据的数据帧:
df = pd.DataFrame({'KEY': ['1','2','3'], 'RECORD': ['1','1','1'], 'SERIAL': ['1470','2321','300'], 'REMARKS': ['FRUIT[APPLES,ORANGES,PEARS] IS HEALTHY FOR YOU','I LIKE FRUIT[BANANAS,CHERRIES,GRAPES], BUT I DON\'T LIKE FRUIT[CANTALOPE,HONEYDEW]', 'THERE IS FRUIT[LEMONS,ORANGES,GRAPEFRUIT] @ 1234']})
我需要将水果提取到与键、记录和序列号相关联的新数据框中。完成后应该是这样的:
df = pd.DataFrame({'KEY': ['1','1','1','2','2','2','2','2','3','3','3'], 'RECORD': ['1','1','1','1','1','1','1','1','1','1','1'], 'SERIAL': ['1470','1470','1470','2321','2321','2321','2321','2321','300','300','300'], 'FRUIT': ['APPLES','ORANGES','PEARS','BANANAS','CHERRIES','GRAPES','CANTALOPE','HONEYDEW','LEMONS','ORANGES','GRAPEFRUIT'], 'CODE': ['null','null','null','null','null','null','null','null','1234','1234','1234']})
根据我所做的研究,看起来我可以使用str.split和/或str.extract,但我不确定如何将每个水果与键、记录和序列匹配。除此之外,最后一条记录还有“@1234”。这些信息还需要提取出来,并与前面列出的3种水果进行匹配
我猜这个过程的第一步是提取水果,这应该很容易,因为它们都是串在一起的
有没有关于如何解决这个问题的建议
谢谢
试试这个:
输出:
如果您愿意,您可以发表评论:
输出:
相关问题 更多 >
编程相关推荐