取消使用lxml和XPath的href title

from lxml import html import requests for i in range(44,530): # Number of pages plus one url = "http://postscapes.com/companies/r/{}".format(i) page = requests.get(url) tree = html.fromstring(page.content) contactemail = tree.xpath('//*[@id="rt-mainbody"]/div/div/div[2]/div[4]/address/a') print contactemail

1条回答

网友

1楼 · 发布于 2024-04-27 04:51:07

有一些方法可以提取相同的值，即电子邮件地址，例如：

# get email address from inner text of the element :
print contactemail[0].text

# get email address from href attribute + substring-after() :
print contactemail[0].xpath('substring-after(@href, "mailto:")')

如果一个address父元素中可能有多个a元素，则可以使用列表理解语法：

^{pr2}$

编程相关推荐

IntelliJ IDEA Java代码样式：注释和枚举之间的空间
java车辆路径问题或工具教程未在eclipse上运行
从HTML表单发布时，java非英语UTF 8字符会发生变化
使用MultiResourceItemReader时，java Spring批处理在CustomLineMapper中获取文件名
java配置JAXB解组器来处理同时具有acessor方法和字段的类
java在JpaRepository findAll（）方法中返回对象的浅拷贝
java如何对docx文件进行碎片整理，以便与ApachePOI3.8一起使用？
java如何将一维数组分解成行？
java为什么这个图形对象不是绘画？（我做错了什么？）
如何在Java代码中将Java函数应用于Scala选项

相关问题更多 >

编程相关推荐

热门问题

热门文章

取消使用lxml和XPath的href title

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >