如何使用Beautiful Soup查找带有特定文本的href链接？

2024-04-25 15:27:43 发布

男 | 程序猿一只，喜欢编程写python代码。

page = urllib2.urlopen('https://www.sec.gov/Archives/edgar/data/1591890/0001493152-18-003887-index.htm').read()
soup = BeautifulSoup(page)
soup.prettify()
# page = requests.get('https://www.sec.gov/Archives/edgar/data/1591890/0001493152-18-003887-index.htm')

# soup = BeautifulSoup(page, 'html.parser')
# Remove bottom links


for link in soup.findAll('a', href=True,text = re.compile('instance')):
    print link['href']

我没有得到任何运行此链接

Tags： https data index www page link sec urllib2

1条回答

网友

1楼 · 发布于 2024-04-25 15:27:43

您只需修改soup调用即可获得findAll（）返回的字典的“href”键。这应该可以满足您的需要：

for link in soup.findAll('a'):
    print(link['href'])

如何使用Beautiful Soup查找带有特定文本的href链接？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用Beautiful Soup查找带有特定文本的href链接？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >