找到适当的正则表达式

2024-04-20 14:35:27 发布

您现在位置:Python中文网/ 问答频道 /正文

你能帮我找到正确的正则表达式来提取(MargauxSaint-Julien)在这两页中的每一次:

page 1Margaux, Rouge

page 22ème Vin, Saint-Julien, Rouge

我的代码:

item ["appelation"] = res.select('.//div[@class="pro_col_right"]/div[@class="pro_blk_trans"]/div[@class="pro_blk_trans_titre"]/text()').re(r'\s*\w+\-\w+\-\w+|\w+\-\w+|\[^Rouge,Blanc]')

我的正则表达式找不到玛歌,但它提取了圣朱利安!!你知道吗


Tags: 代码divtranspageitemproclassjulien
1条回答
网友
1楼 · 发布于 2024-04-20 14:35:27

不知道为什么需要这个,但是假设s是您的html文件,那么这个正则表达式将找到您要查找的内容。。你知道吗

import re
m = re.search(r"\<div\ class=\"pro_blk_trans_titre\"\>(.*)\</div\>", s)
print(m.group(1).strip().encode("utf8"))

# page1: b'Margaux, Rouge'
# page2: b'2\xc3\xa8me Vin, Saint-Julien, Rouge'

相关问题 更多 >