import requests
from bs4 import BeautifulSoup
url = 'http://www.gmcgujarat.org/searchdoctor.aspx'
html = requests.get(url).text
soup = BeautifulSoup(html, 'html.parser')
name = soup.find(" ")
for count in range(3333,4444):
data = {name: " "}
r = requests.post(url, data=data)
soup = BeautifulSoup(r.text, 'html.parser')
table = soup.find('table',{"id":"divtest"})
for tr in table.find_all('tr',class_='odd')[1:5]:
print tr.text
代码没有给出'tr'和'td'数据,因为'tr'是以奇偶形式给出的,我不知道如何从中删除数据。你知道吗
在这个网站上获得所有
td
价值的最简单方法是因为您需要进一步挖掘
tr
以找到所有td
但是假设你只关心
class='odd'
,那么在find_all
中添加class_='odd'
已经是正确的方法了。你知道吗但是,如果某些行(
tr
)包含您不需要的数据怎么办。假设您只想获得带有class='odd'
或class='even'
的所有行,但是有些行带有class='na'
。你知道吗实际上,您可以将dict传递给
find_all
中的类标识符,如下所示:或者更进一步通过
相关问题 更多 >
编程相关推荐