Python htmltotext-0.7.3.tar.gz模块包


下面是该Python项目安装包的资源下载地址:

  • htmltotext-0.7.3.tar.gz.source

  • 文件名称:htmltotext-0.7.3.tar.gz

    版权声明:本程序为网上收集,用户上传,仅供研究学习计算机编程等技术为目的,版权归原作者所有。

    所属PyPI项目:htmltotext


  • 文件大小: 27.6 kB

    文件类型: Source

    适用的Python版本:None

    下载文件的哈希值:
        SHA256:7d57e5161a38ecfbad8e7d5f6e16b792b66f1c0a615e80bd78fd0efbf03a5b15
        MD5:3b6125bb2b8ebe0c60235dbb45a3205f
        BLAKE2-256:1aee2f92c5077c1cf6d0fd6df8cb950e6cc0552082933c5da300ab78ab710ca5






  1. 如果发现本程序安装包或源码失效或下载失败,可以联系站长修复!谢谢。
  2. 可以使用迅雷等多线程下载专用软件进行加速下载。
  3. 少部分程序支持BT/磁力下载。
  4. 少部分程序可能需要编译安装,或下载源码自行安装,也可以使用 pip 命令进行安装。
  5. 放在网盘上的资源可能会被限速,可能需要注册或者购买对方VIP服务才能快速的下载。
  6. 如遇压缩包需要密码解压的,密码为 www.cnpython.com (全部小写),不是此密码非本站下载资源。

PyPI项目包:htmltotext

这个包是为一个搜索引擎编写的,允许它提取 HTML页面中的文本内容和元数据。它试图应付 无效的标记和错误指定的字符集,并删除 HTML标记(在标记处适当地拆分单词)。它还丢弃 脚本标记和样式标记的内容。

除了页面正文中的文本,它还提取页面标题, 以及元描述和关键字标记的内容。它还可以解析 meta robots标记以确定是否应为页编制索引。

此模块使用的HTML解析器是从Xapian搜索中提取的 引擎库(具体地说,从OMISK索引实用程序 那个图书馆)。

查看全文