如何打开一个URL,然后打开另一个附加到关键字的URL?

2024-04-25 04:39:16 发布

您现在位置:Python中文网/ 问答频道 /正文

基本上,我希望脚本能够打开一个URL,然后搜索关键字并打开附加到关键字的链接。

下面是一个例子,我想打开Supreme New York的夹克URL,我想打开一个名为Cheetah Hooded jacket(在网站更新之前泄露)的夹克的URL,它位于Supreme jacket的URL上。我需要能够做到这一点后,网站更新秒,所以我将无法事先知道网址只是打开它从一开始。我必须打开第一个URL并使用关键字查找第二个URL,然后使用Python打开它。你知道吗

我已经知道如何打开URL:

import webbrowser
webbrowser.open('https://www.supremenewyork.com/shop/all/jackets')

但我不知道如何使用关键字来查找附加到它的URL。你知道吗


Tags: 脚本urlnew网站链接关键字例子网址
1条回答
网友
1楼 · 发布于 2024-04-25 04:39:16

首先,如果您正在查找页面的内容,则需要向该页面发出请求,而不仅仅是打开它。例如,要使用requests模块获取页面内容(通过pip获取),您可以编写以下代码:

import requests

req = requests.get('https://www.supremenewyork.com/shop/all/jackets')
req.raise_for_status()

content = req.text()

然后,您可以使用正则表达式或处理html的BeautifulSoup模块(也可以通过pip)来查找所需的链接。
使用正则表达式,您的代码如下所示:

import re

# get content

for match in re.findall(r'<a.*>', content):
    if match and 'some criteria' in match.group(0):
       new_url = re.search('href=\"(.*)\"', match.group(0))

       if new_url:
           new_url = new_url.group(1)

从这里开始,只需在webbrowser中打开new_url,就可以开始了。 像往常一样,自己查找这些模块,这样您就知道如何使我的代码适应您的需要,并在将来解决其他类似的问题。你知道吗

另外,我不知道我使用的正则表达式是否适合你的用例,但是你知道的。

希望这有帮助!你知道吗

链接

请求:http://docs.python-requests.org/en/master/

美丽之群:https://www.crummy.com/software/BeautifulSoup/bs4/doc/

正则表达式:https://docs.python.org/3/library/re.html

相关问题 更多 >