Python dataframe regex创建新列从文本

1条回答

网友

1楼 · 发布于 2024-05-16 20:45:18

首先得到正则表达式模式。我看到你的模式的逻辑是：

每个名字都以大写字母开头，
名称前有空格
“开始”的名称后面有一个字符（感叹号或句号），
在名称后面有一个空格，否则连地球都会被计算在内，这是我们不想要的

下面的正则表达式是：

re1='(\\s+)'                    # White Space 1
re2='((?:[A-ZÀ-ÿ][a-zÀ-ÿ]+))'   # Word 1
re3='([.!,?\\-])'               # Any Single Character 1
re4='(\\s+)'                    # White Space 2

我使用这个网站来获取我的正则表达式：https://txt2re.com/

现在做：

df['name'] = df['text'].str.extract(re1+re2+re3+re4, expand=True)[1]

输出：

0     John
1    Randy
2     Mike
3   Amélie
Name: name, dtype: object

编程相关推荐

java调用Python函数作为TEID中的UDF
java Android。支持v4导入不工作
java如何影响具有静态属性的类
java如何在从glTexImage2D（）分配后编辑纹理的像素颜色
javaspringboot+rediscache+@Cacheable适用于某些方法，而不适用于其他方法
java无法将动态Web模块方面从3.0更改为2.5
java如何在新选项卡中显示打印的文档？
java Google Cloud Endpoints API方法仅在删除用户参数时成功调用
java为什么我可以使用Stack<Double>但不能使用Stack<Double>？
java JDBC PreparedStatement似乎忽略了占位符

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python dataframe regex创建新列从文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >