我有一个df:
name sample
1 a Category 1: qwe, asd (line break) Category 2: sdf, erg
2 b Category 2: sdf, erg(line break) Category 5: zxc, eru
...
30 p Category 1: asd, Category PE: 2134, EFDgh, Pdr tke, err
最后我需要:
name qwe asd sdf erg zxc eru 2134 EFDgh Pdr tke err
1 a 1 1 1 1 0 0 0 0 0 0
2 b 0 0 1 1 1 1 0 0 0 0
...
30 p 0 1 0 0 0 0 0 1 1 0
老实说,我甚至不知道从哪里开始这一个,我的第一个想法是分裂它在断线,但我有点迷路后。你知道吗
IIUC您可以使用^{} 和regex模式来查找包含3个字符的所有单词,其中negative lookbehind and lookahead表示非字符符号。然后,您可以将获得的列表与^{} 连接起来,并使用^{} 获得您的假人。然后可以删除额外的列:
删除额外列后,您将得到以下结果:
相关问题 更多 >
编程相关推荐