有没有一种计算效率更高的方法来使用Pandas查找与正则表达式匹配的第一个匹配项？

Input: s= pd.Series(["David Matt Juan Peter David James", "Scott David Peter Sam David Ron", "Dan Phil David Sam Pedro David Mani"]) s_find= s.str.findall(r'David [A-za-z]*') print(s_find) Output: 0 [David Matt, David James] 1 [David Peter, David Ron] 2 [David Sam, David Mani] Input: s_find= s_find.str[0] print(s_find) Output: 0 David Matt 1 David Peter 2 David Sam

1条回答

网友

1楼 · 发布于 2024-05-16 22:59:22

您可以使用str.extract仅获取第一个匹配项：

s.str.extract('(David [A-za-z]*)')

这将返回：

0     David Matt
1    David Peter
2      David Sam
dtype: object

或者，避免使用str方法，可以使用列表理解：

import re

pd.Series([re.search('(David [A-za-z]*)', i).group() for i in s.values])

0     David Matt
1    David Peter
2      David Sam
dtype: object

编程相关推荐

java如何修复尝试将用户签名到服务器主机时出现的“字符串无法转换为json对象”错误？
控制台Java：不使用新行更新命令行中的文本
java servlet接收xml数据时，出现错误
使用REST API在Bitbucket中复制或复制存储库
java如何在JavaFX中对齐一行？
java如何在活动中显示通过服务获得的数据？
返回BigDecimal作为字符串：返回int
java组织。openqa。硒。InvalidSelectorException：尝试查找元素时选择器无效
java仅在阻塞状态下通知和通知所有影响线程
java JBOSS无法启动部署

相关问题更多 >

编程相关推荐

热门问题

热门文章

有没有一种计算效率更高的方法来使用Pandas查找与正则表达式匹配的第一个匹配项？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >