Python中文
首页
教程
问答
标签
搜索
登录
注册
每天早上的财务数据
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正试图从晨星网站搜集以下数据:</p> <p><a href="http://financials.morningstar.com/ratios/r.html?t=IBM&region=USA&culture=en_US" rel="nofollow noreferrer">http://financials.morningstar.com/ratios/r.html?t=IBM&region=USA&culture=en_US</a></p> <p>我目前正在尝试只做IBM,但希望最终能够键入另一家公司的代码,并对该公司做同样的事情。我的代码如下:</p> <pre><code>import requests, os, bs4, string url = 'http://financials.morningstar.com/ratios/r.html?t=IBM&region=USA&culture=en_US'; fin_tbl = () page = requests.get(url) c = page.content soup = bs4.BeautifulSoup(c, "html.parser") summary = soup.find("div", {"class":"r_bodywrap"}) tables = summary.find_all('table') print(tables[0]) </code></pre> <p>我目前遇到的问题是,不像一个简单的网页,我刮了程序似乎无法找到任何表,即使我可以看到他们在HTML的网页。</p> <p>在研究这个问题时,最接近的stackoverflow问题如下:</p> <p><a href="https://stackoverflow.com/questions/34315522/python-webscraping-noneobeject-failure-broken-html">Python webscraping - NoneObeject Failure - broken HTML?</a></p> <p>在这篇文章中,他们解释说晨星的表是动态加载的,并使用了一些我不熟悉的json代码,并且不知何故生成了一个不同的weblink,该weblink成功地收集了数据,但我不明白它是从哪里来的?</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我发现JavaScript比Python+Selenium更容易删除动态站点。有一个很好的模块用于<code>nodejs</code>/<code>phantomjs</code>:<a href="https://github.com/ruipgil/scraperjs" rel="nofollow">ScraperJS</a>。它非常容易使用:它将jQuery注入到已刮除的页面中,您可以使用jQuery选择器提取数据。</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django restfram生成PDF
8 回答
无法使用Django Rest框架发送压缩的gzip数据
6 回答
无法使用Django rest框架进行身份验证(请求用户=匿名用户)
1 回答
无法使用Django、Python和JavaScrip触发onclick函数
3 回答
无法使用Django.views.generic.View保存表单
6 回答
无法使用Django(python 2.7,OS X 10.11.1)
6 回答
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
9 回答
无法使用Django\u mssql\u后端迁移到外部hos
6 回答
无法使用Django&Python3.4连接到MySql
10 回答
无法使用Django+nginx上载媒体文件
8 回答
无法使用Django1.6导入名称模式
2 回答
无法使用Django1.7和mongodb登录管理站点
4 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
2 回答
无法使用Djangockedi验证CBV中的字段
9 回答
无法使用Djangocketditor上载图像(错误400)
4 回答
无法使用Djangocron进行函数调用
5 回答
无法使用Djangofiler djang上载文件
8 回答
无法使用Djangokronos
5 回答
无法使用Djangomssql provid
1 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
7 回答