我有个问题。它在URL列表中循环,但不会将每个页面的文本内容添加到预设列表中
我还没有开始处理原始文本。如果我不明白的话,我可能会在我到达那里后提出一个问题
这里怎么了?PRELTS的长度保持为1,即使它似乎在scrape的URL列表中循环
以下是我遇到问题的部分代码:
counter=0
for xa in range(0,len(qresults)):
pageURL=qresults[xa].format()
pageresp= requests.get(pageURL, headers=headers)
if pageresp.status_code==200:
print(pageURL)
psoup=BeautifulSoup(pageresp.content, 'html.parser')
presults=[]
para=psoup.text
presults.append(para)
print(len(presults))
else: print("Could not reach domain")
print(len(presults))
好的,我甚至没有看到您在这里循环任何URL,但下面是一个如何实现此类请求的通用示例
你眼前的问题是:
在每次
for
迭代中,用空列表替换现有的presults
列表并添加一项。在下一次迭代中,再次删除上一个结果您的初始化只能一次,并且在循环之前:
相关问题 更多 >
编程相关推荐