用Python实现Kindle的文本编码

2024-04-20 02:05:39 发布

男 | 程序猿一只，喜欢编程写python代码。

基本上，我用python用Beautifulsoup从网页上抓取文本，然后将其保存为HTML并作为邮件附件发送到Kindle。问题是，Kindle支持拉丁文1（ISO-8859-1）编码，但是我解析的文本包含的字符不是拉丁文1的一部分。因此，当我尝试将文本编码为Latin1时，由于非法字符，python会出现以下错误：

UnicodeEncodeError: 'latin-1' codec can't encode character u'\u2019' in position 17: ordinal not in range(256)

当我尝试将其编码为UTF-8时，这次脚本运行得非常完美，但是Kindle用乱码替换了一些不兼容的字符。你知道吗

Tags： in 文本网页编码 html 错误 iso 字符

0条回答

目前没有回答

编程相关推荐

禁用Eclipse Java调试器的热代码替换
每次运行jUnit测试时，JavaIntelliJIDEA都会重建整个模块
java如何从InputStream对象读取特定数据？
java我想在每次从recyclerview中单击一个项目时将对象添加到领域数据库
安卓在C和系统中退出（0）的实践。在Java中退出（0）
azure如何将文本文件附加到java中现有的zip文件？
java Spring安全性工作在tomcat服务器（Eclipse）上，但当我将war文件放入tomcat webapp时，Spring安全性就不工作了
java为什么在提供lambda参数时必须捕获异常？
java公共类扩展了JPanel
java如何在SpringAspectJ中使用“declare”指令？

用Python实现Kindle的文本编码

相关问题更多 >

编程相关推荐

热门问题

热门文章

用Python实现Kindle的文本编码

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >