Python htmltotext-0.7.3.tar.gz模块包
下面是该Python项目安装包的资源下载地址:
htmltotext-0.7.3.tar.gz.source
文件名称:htmltotext-0.7.3.tar.gz
版权声明:本程序为网上收集,用户上传,仅供研究学习计算机编程等技术为目的,版权归原作者所有。
所属PyPI项目:htmltotext
文件大小: 27.6 kB
文件类型: Source
适用的Python版本:None
下载文件的哈希值:
SHA256:7d57e5161a38ecfbad8e7d5f6e16b792b66f1c0a615e80bd78fd0efbf03a5b15
MD5:3b6125bb2b8ebe0c60235dbb45a3205f
BLAKE2-256:1aee2f92c5077c1cf6d0fd6df8cb950e6cc0552082933c5da300ab78ab710ca5
选择下载地址 热度
851 ℃ | 2024-04-29
- 如果发现本程序安装包或源码失效或下载失败,可以联系站长修复!谢谢。
- 可以使用迅雷等多线程下载专用软件进行加速下载。
- 少部分程序支持BT/磁力下载。
- 少部分程序可能需要编译安装,或下载源码自行安装,也可以使用
pip
命令进行安装。 - 放在网盘上的资源可能会被限速,可能需要注册或者购买对方VIP服务才能快速的下载。
- 如遇压缩包需要密码解压的,密码为 www.cnpython.com (全部小写),不是此密码非本站下载资源。
PyPI项目包:htmltotext
这个包是为一个搜索引擎编写的,允许它提取 HTML页面中的文本内容和元数据。它试图应付 无效的标记和错误指定的字符集,并删除 HTML标记(在标记处适当地拆分单词)。它还丢弃 脚本标记和样式标记的内容。
除了页面正文中的文本,它还提取页面标题, 以及元描述和关键字标记的内容。它还可以解析 meta robots标记以确定是否应为页编制索引。
此模块使用的HTML解析器是从Xapian搜索中提取的 引擎库(具体地说,从OMISK索引实用程序 那个图书馆)。
查看全文