我需要打开一个在另一个URL中的URL,但我不知道怎么做
这是我写的代码(我是初学者),它向我发送了一个回溯:URLError:<;urlopen错误未知url类型:“http>
请帮帮我
谢谢你
import re
import urllib.request, urllib.parse, urllib.error
fhand=urllib.request.urlopen("http://dr-chuck.com/page1.htm")
for line in fhand:
words=line.decode().strip()
if re.search("href=", words):
print(words)
w=words.split()
print(w)
i=w[1]
print(i)
p=i[5:40]
print(p)
q=urllib.request.urlopen(p)
print(q)
这个问题太宽泛,无法直接给出答案,但是作为一般方法,您需要使用诸如
Scrapy
或BeautifulSoup
之类的刮取库然后对父URL(即http://dr-chuck.com/page1.htm)执行
GET
请求并解析该页面的HTML。然后,您将定位并提取href
HTML标记,并将URL本身保存到另一个变量中,然后对该变量执行另一个GET请求相关问题 更多 >
编程相关推荐