正则表达式:如果名称在“句”中,则匹配该“句”

2024-05-16 11:30:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个熊猫人的数据框和每一排的跑步报告。每句话都向一个名字汇报。菲利普·杰弗瑞开局很好。鲍勃·莫尔一开始就绊倒了。名字的长度可以达到5个单词。因此,我希望能够匹配他们的报告给每个人。所以Philip在数据帧的一行,在事件报告中应该说“Philip Jeffery启动得很好。”所以我认为REGEX是完美的,但是在网上找不到任何关于这个问题的信息,我对这个引擎还很陌生。如果名字只有一个词的长度,这就是我到目前为止所知道的。你知道吗

if len(NameTokens)==1:
    REGEX=r"(^\\s+{}(?:[A-Za-z,;'\"\\s]+[.?!]$))".format(NameTokens[0])
    #print(REGEX)
    RunnerReport=df_merge['Incident Report'].str.extract(REGEX, expand=True)
    print(RunnerReport)

NameTokens是标记到列表中的名称,例如['Philip','Jeffery']。你知道吗

变量REGEX需要使用REGEX,因为目前我的REGEX没有返回任何结果,只返回NAN值。我对REGEX还是个新手。你知道吗

谢谢!你知道吗

更新。我在GRNZ网站上的GRNZ事件报告中输入了信息,下面是一个示例:https://www.grnz.co.nz/catch-the-action/13000/stewards-report.aspx。我正在尝试解析这些表,并将每个跑步者的名字与他们的报告相匹配。你知道吗

例如,漏斗(1)-在开始失地后,闭合触点。在第一个转弯处就失去了地面。兽医检查未发现异常。激发他们(2)-开始后接触几步。在第一个转弯处相撞。杰森熊(3)-开始后颠簸,然后转移出去接触一段距离后直。《最爱》(4)在第一个转弯处相撞。BIGTIME SASSY(5)-在第一个转弯时换掉高跟鞋。光明的概念(6)-颠簸进入最后的直和再次结束阶段。金贾小子(7)-慢走。不方便的背部笔直接触一段距离,在脚跟间移动,失去平衡。检查弯曲处是否从鞋跟处移开。克拉普顿(8)-颠簸进入最后的直和再次结束阶段。你知道吗


Tags: 数据信息报告philip名字阶段跑步regex