urllib2.Request不返回完整的html文件

import urllib2 from bs4 import BeautifulSoup url='http://www.nutritionvalue.org/foods_start_with_A.html' hdr={'User-Agent':'Mozilla/5.0'} request = urllib2.Request(url,headers=hdr) text=urllib2.urlopen(request).read() soup=BeautifulSoup(text)

1条回答

网友

1楼 · 发布于 2024-04-26 23:33:56

您的缓冲区可能有错误。如果是这样的话，你需要做的是使用一个循环来写出你接收到的结果。你知道吗

url='http://www.nutritionvalue.org/foods_start_with_A.html'
hdr={'User-Agent':'Mozilla/5.0'}
request = urllib2.Request(url, headers=hdr)
qrequest = urllib2.urlopen(request)
text = ""
chunk = True
    while chunk:
        chunk = qrequest.read(1024)
        text += chunk
    qrequest.close()
soup = BeautifulSoup(text)

编程相关推荐

java linkedlist字符串排序算法
枚举类上出现maven错误的java ProGuard
java如何将ActionBar徽标设置为文本（TextView）？
swing当剪贴板内容在java之外发生更改时，是否可以得到通知
javascript从网络摄像头拍摄照片并保存到服务器上
java如何使用流将列表中的选定元素复制到另一个列表
使用eBay API获取产品详细信息的java
java ANTLR树中的子级数未知
java Selenium：访问'file:///C://Users//DELL//Desktop//Project%20UI//FastHome.html“剧本被拒绝了
如何在Java web项目中抛出一个无法捕获并结束执行的异常？

相关问题更多 >

编程相关推荐

热门问题

热门文章

urllib2.Request不返回完整的html文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >