我会抓取有iframe的网站。在
见http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20150515001896。它在chrome浏览器上有两个选项。(“查看页面源”和“视图框架源代码”都可以。)
但是使用beautifulsoup、urllib2或selenium访问url时,只得到了没有iframe的页面源代码
我如何访问可以在chrome上看到的iframe源代码?在
下面的代码用于访问该网站的页面源代码。在
from selenium import webdriver
import urllib2
from bs4 import BeautifulSoup
url = "http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20150515001896"
f = urllib2.urlopen(url)
#or
browser = webdriver.Chrome()
browser.get(url)
html_source = browser.page_source
#show only the page sources
只需访问下面的url就可以解决这个问题。在
http://dart.fss.or.kr/report/viewer.do?rcpNo=20150515001896&dcmNo=4671059&eleId=17&offset=1015699&length=132786&dtd=dart3.xsd
相关问题 更多 >
编程相关推荐