Python中文
首页
教程
问答
标签
搜索
登录
注册
从一个用靓汤制作的网站上筛选返回的列表
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我用python编写代码。我一直在网上搜寻nba选秀的名字、球队形象和大学前景。但是当我刮取大学的名字时,我会同时看到学院页面和学院名称。我怎样才能得到它,这样我就只能看到大学了?我试过在锚点的末尾添加.string和.text(锚定.string). 在</p> <pre><code>import urllib2 from BeautifulSoup import BeautifulSoup # or if your're using BeautifulSoup4: # from bs4 import BeautifulSoup list = [] soup = BeautifulSoup(urllib2.urlopen( 'http://www.cbssports.com/nba/draft/mock-draft' ).read() ) rows = soup.findAll("table", attrs = {'class':'data borderTop'})[0].tbody.findAll("tr")[2:] for row in rows: fields = row.findAll("td") if len(fields) >= 3: anchor = row.findAll("td")[2].findAll("a")[1:] if anchor: print anchor </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>html中锚的格式是<code><a href='web_address'>Text-that-is-displayed</a></code>,所以除非已经有了一个奇特的html解析器库(我敢打赌有,只是不知道有什么),否则您可能需要使用某种正则表达式来解析出所需的锚定部分。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
plt.savefig不会覆盖现有文件
10 回答
plt.savefig不保存图像
4 回答
plt.savefig在jupyter笔记本中不起作用
5 回答
plt.savefig在从另一个fi调用时停止工作
5 回答
plt.savefig在调用plt.show之前保存空数字
3 回答
plt.save不创建png文件
4 回答
plt.scatter overlay分类数据帧列
7 回答
Plt.Scatter:如何添加title、xlabel和ylab
2 回答
plt.scatter()绘图与Matplotlib中的plt.plot()绘图类似
1 回答
plt.scatter错误'NoneType'对象在成功运行后没有属性'sqrt'
2 回答
plt.set_title()中的标题字符串有误
9 回答
plt.show()
2 回答
plt.show()不在Jupyter笔记本上渲染任何内容
1 回答
plt.show()不打印plt.plot only plt.scatter
4 回答
plt.show()不显示三维散射图像
5 回答
plt.show()不显示任何内容
3 回答
plt.show()不显示数据,而是保留它供下一个图表使用(spyder)
3 回答
plt.show()使终端挂起
2 回答
plt.show()无法使用此代码
4 回答
plt.show()没有打开新的图形风
8 回答