加载Javascript后获取HTML代码

2024-04-20 08:20:54 发布

男 | 程序猿一只，喜欢编程写python代码。

我正试着浏览这个网站。我想要主桌。但问题是表是通过Javascript加载的。所以这个表的HTML代码不能被刮取。这是密码。在

from urllib.request import urlopen
from bs4 import BeautifulSoup
from selenium import webdriver 
import time

driver = webdriver.PhantomJS(executable_path='') 
driver.get("http://bet.hkjc.com/racing/pages/odds_wp.aspx?date=30-01-2017&venue=ST&raceno=5&lang=en") 
time.sleep(3)
pageSource = driver.page_source
bsObj = BeautifulSoup(pageSource) 
print(bsObj.find(id="detailWPTable").get_text())

我想得到表中的内容。请帮忙！在

Tags：代码 from import 密码 get time 网站 html

1条回答

网友

1楼 · 发布于 2024-04-20 08:20:54

您可以尝试使用^{}，如下所示：

from bs4 import BeautifulSoup as BS
import dryscrape

ses=dryscrape.Session()
ses.visit("http://bet.hkjc.com/racing/pages/odds_wp.aspx?date=30-01-2017&venue=ST&raceno=1&lang=en")
soup = BS(ses.body(), 'lxml') # Parse page content 

print(soup.find(id="detailWPTable").get_text())

输出：

^{pr2}$

加载Javascript后获取HTML代码

相关问题更多 >

编程相关推荐

热门问题

热门文章

加载Javascript后获取HTML代码

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >