我正在尝试用Python解析HTML源代码。我使用BeautifulSoup
就是为了这个目的。我需要得到的是以nameX
格式获得所有带有ID的td
标记,其中X从1开始。因此它们的数量是我们拥有的数量的name1, name2, ...
我怎样才能做到这一点?我使用regex的简单代码不起作用
soup = BeautifulSoup(response.text,"lxml")
resp=soup.find_all("td",{"id":'name*'})
错误:
IndexError: list index out of range
Tags:
使用lambda+startswith
或正则表达式
相关问题 更多 >
编程相关推荐