如何在Pandas身上脱衣和分裂

df['Source Hostname'] 0 test1\ntest2\ntest3 1 test5 2 test7\ntest8\n 3 test1 4 test2\ntest4 Name: Source Hostname, dtype: object df["Source Hostname"].str.split('\n').apply(lambda z: [e.strip() for e in z]).tolist() [['test1', 'test2', 'test3'], ['test5'], ['test7', 'test8', ''], ['test1'], ['test2', 'test4']]

2条回答

网友

1楼 · 编辑于 2024-04-25 17:43:44

df['Source'].str.split('\n').apply(lambda x: [e.strip() for e in x]).tolist()

网友

2楼 · 编辑于 2024-04-25 17:43:44

使用^{}删除跟踪空格，然后使用regex \s*\n\s*删除\n前后的一个或零个空格：

df = pd.DataFrame({'Source':['test1   \n test2   ',
                             '    test1   \n test2   ',
                             '    test1   \ntest2   ']})
print (df)
                    Source
0      test1   \n test2   
1      test1   \n test2   
2       test1   \ntest2

Data = (df["Source"].str.strip().str.split("\s*\n\s*").to_list())
print (Data)
[['test1', 'test2'], ['test1', 'test2'], ['test1', 'test2']]

或者，如果可能的话，可以用任意空格分割（这里指空格或\n）：

Data = (df["Source"].str.strip().str.split().to_list())
print (Data)
[['test1', 'test2'], ['test1', 'test2'], ['test1', 'test2']]

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在Pandas身上脱衣和分裂

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >