如何使用Python在另一个URL中打开URL?

2024-04-27 04:27:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要打开一个在另一个URL中的URL,但我不知道怎么做

这是我写的代码(我是初学者),它向我发送了一个回溯:URLError:<;urlopen错误未知url类型:“http>

请帮帮我

谢谢你

import re 
import urllib.request, urllib.parse, urllib.error

fhand=urllib.request.urlopen("http://dr-chuck.com/page1.htm")
for line in fhand:
    words=line.decode().strip()
    if re.search("href=", words):
        print(words)
        w=words.split()
        print(w)
        i=w[1]
        print(i)
        p=i[5:40]
        print(p)
        q=urllib.request.urlopen(p)
        print(q)

1条回答
网友
1楼 · 发布于 2024-04-27 04:27:30

这个问题太宽泛,无法直接给出答案,但是作为一般方法,您需要使用诸如ScrapyBeautifulSoup之类的刮取库

然后对父URL(即http://dr-chuck.com/page1.htm)执行GET请求并解析该页面的HTML。然后,您将定位并提取hrefHTML标记,并将URL本身保存到另一个变量中,然后对该变量执行另一个GET请求

相关问题 更多 >