在python中用selenium
刮取和用re
解析
从弦上
<div type="copy3" class="sc-bxivhb dHqnfT">756 W Peachtree St NW Atlanta GA 30308</div>
我想回来
756 W Peachtree St NW Atlanta GA 30308
这个正则表达式
("copy3").*?(?=</div>)
把我还给你
"copy3" class="sc-bxivhb dHqnfT">756 W Peachtree St NW Atlanta GA 30308
但是我想排除所有在>
之前的756
我怎么包括这个
匹配
>
,然后捕获组中后面的非<
,并提取该组:https://regex101.com/r/BX2tVj/1
如果您想只匹配第一个
<
之后的内容,您就必须使用lookback(只有您确切地知道class=""
属性可能包含的内容时,lookback才是可靠的):https://regex101.com/r/BX2tVj/2
或者改用regex模块,这样就可以使用
\K
:https://regex101.com/r/BX2tVj/3
用硒刮擦,用硒来得到
相关问题 更多 >
编程相关推荐