Python中文
首页
教程
问答
标签
搜索
登录
注册
在版权符号上美化组失败
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我收到一个Unicode错误:<code>UnicodeEncodeError: 'charmap' codec can't encode character u'\xa9' in position 822: character maps to <undefined></code></p> <p>这似乎是一个标准的版权符号,在HTML中是©。我一直找不到一个办法来摆脱这一切。我甚至尝试了一个自定义函数来用空格替换copy,但是同样的错误也失败了。</p> <pre><code>import sys import pprint import mechanize import cookielib from bs4 import BeautifulSoup import html2text import lxml def MakePretty(): def ChangeCopy(S): return S.replace(chr(169)," ") br = mechanize.Browser() # Cookie Jar cj = cookielib.LWPCookieJar() br.set_cookiejar(cj) # Browser options br.set_handle_equiv(True) #br.set_handle_gzip(True) br.set_handle_redirect(True) br.set_handle_referer(True) br.set_handle_robots(False) # Follows refresh 0 but not hangs on refresh > 0 br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1) # User-Agent (this is cheating, ok?) br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')] # The site we will navigate into, handling its session # Open the site br.open('http://www.thesitewizard.com/faqs/copyright-symbol.shtml') html = br.response().read() soup = BeautifulSoup(html) print soup.prettify() if __name__ == '__main__': MakePretty() </code></pre> <p>我怎样才能通过版权标志变得漂亮呢?我在网络上到处寻找解决方案,但都没有结果(或者我可能不理解,因为我对Python和scraping还不太熟悉)。</p> <p>谢谢你的帮助。</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我也有同样的问题。这可能对你有用:</p> <p><code>print soup.prettify().encode('UTF-8')</code></p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
我是否正确构建了这个递归神经网络
9 回答
我是否正确理解acquire和realease是如何在python库“线程化”中工作的
2 回答
我是否正确理解Keras中的批次大小?
6 回答
我是否正确理解PyTorch的加法和乘法?
5 回答
我是否正确组织了我的Django应用程序?
7 回答
我是否正确计算执行时间?如果是这样,那么并行处理将花费更长的时间。这看起来很奇怪
5 回答
我是否每次创建新项目时都必须在PyCharm中安装numpy?(安装而不是导入)
4 回答
我是否每次运行jupyter笔记本时都必须重新启动内核?
5 回答
我是否用python安装了socks模块?
4 回答
我是否真的需要知道超过一种语言,如果我想要制作网页应用程序?
5 回答
我是否缺少spaCy柠檬化中的预处理功能?
8 回答
我是否缺少给定状态下操作的检查?
7 回答
我是否能够使用函数“count()”来查找密码中大写字母的数量((Python)
1 回答
我是否能够使用用户输入作为colorama模块中的颜色?
5 回答
我是否能够创建一个能够添加新Django.contrib.auth公司没有登录到管理面板的用户?
2 回答
我是否能够将来自多个不同网站的数据合并到一个csv文件中?
6 回答
我是否能够将目录路径转换为可以输入python hdf5数据表的内容?
7 回答
我是否能够等到一个对象被销毁,直到它创建另一个对象,然后在循环中运行time.sleep()
5 回答
我是否能够通过CBV创建用户实例,而不是首先创建表单?(Django)
3 回答
我是否要使它成为递归函数?
6 回答