这个问题被问了很多,但我仍然不接近解决方案。我有一个类似这样的专栏
我想做的是在不同的栏中分开国家和语言,如
Country Language
Vietnam Vietnamese_display 1
Indonesia Tamil__1
India Tamil_Video_5
我使用下面的代码来完成它,但是有很多因素需要考虑,我不知道如何做
df[['Country', 'Language']] = df['Line Item'].str.split('_\s+', n=1, expand=True)
如何跳过第一个“u”以获得所需的结果?谢谢
你可以用
见regex demo
详细信息
^
-字符串的开头_*
-0个或多个下划线([^_]+)
-捕获组1:除_
以外的任何一个或多个字符_
-a_
字符(.+)
-组2:除换行符以外的任何一个或多个字符李>熊猫测试:
相关问题 更多 >
编程相关推荐