加载Javascript后获取HTML代码

2024-04-20 08:20:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我正试着浏览这个网站。我想要主桌。但问题是表是通过Javascript加载的。所以这个表的HTML代码不能被刮取。这是密码。在

from urllib.request import urlopen
from bs4 import BeautifulSoup
from selenium import webdriver 
import time

driver = webdriver.PhantomJS(executable_path='') 
driver.get("http://bet.hkjc.com/racing/pages/odds_wp.aspx?date=30-01-2017&venue=ST&raceno=5&lang=en") 
time.sleep(3)
pageSource = driver.page_source
bsObj = BeautifulSoup(pageSource) 
print(bsObj.find(id="detailWPTable").get_text())

我想得到表中的内容。请帮忙!在


Tags: 代码fromimport密码gettime网站html
1条回答
网友
1楼 · 发布于 2024-04-20 08:20:54

您可以尝试使用^{},如下所示:

from bs4 import BeautifulSoup as BS
import dryscrape

ses=dryscrape.Session()
ses.visit("http://bet.hkjc.com/racing/pages/odds_wp.aspx?date=30-01-2017&venue=ST&raceno=1&lang=en")
soup = BS(ses.body(), 'lxml') # Parse page content 

print(soup.find(id="detailWPTable").get_text())

输出:

^{pr2}$

相关问题 更多 >