用于将docx文件从SharePoint转换为文本的python模块

docx-text的Python项目详细描述


版权所有(c)2019 Shubham Dipt博士

兹免费准许任何人取得复制品 本软件及其相关文档文件(“软件”)的 在软件中不受限制,包括但不限于权利 使用、复制、修改、合并、发布、分发、再授权和/或出售 软件的副本,并允许软件的使用者 根据以下条件提供:

上述版权声明和本许可声明应包括在所有 软件的副本或大部分。在

本软件按“原样”提供,无任何形式的保证,明示或 包括但不限于适销性保证, 特定目的的适用性和非侵犯性。在任何情况下 作者或版权持有人应对任何索赔、损害赔偿或其他 无论是在合同诉讼、侵权诉讼或其他诉讼中,由以下原因引起的责任:, 与软件、软件的使用或其他交易有关 软件。在

说明:#docx文本

Converts docx file from Sharepoint, One drive as well as individual files to text format.

## Installation

$pip install docx-text

依赖关系

  • Python3

使用

>>>import doctext >>>doc_text = doctext.DocFile(url=download_url_of_file) >>>text = doc_text.get_text() # or you may directly enter the path to docs file. >>>doc_text = doctext.DocFile(doc=path_to_docx_file)

改编自https://github.com/ankushshah89/python-docx2txt

站台:任何 分类器:编程语言::Python::3 分类器:License::OSI Approved::MIT License 分类器:操作系统::独立于操作系统 类型:文字/降价

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何显示因用户而异的SQLite存储数据?   转换java。sql。将映射传递给Jackon的valueToTree方法时StringNode的时间戳   从java中的列表json获取值   unicode Java字符存储在什么编码中?   java如何让Spring数据存储库中的默认方法命中缓存?   java使用readClassDescriptor()和resolveClass()来允许序列化版本控制   数组通过另一个矩阵的一部分填充矩阵   如果包含使用正则表达式的字符串,则替换父XML标记的java   java清除SharedReference中的单个变量   java将变量值从一个jsp页面传输到另一个jsp页面   java JDBC+SQLite:DriveManager不加载所需的驱动程序   相同源代码的java Kotlin构建生成不同的二进制文件   Java中的元组枚举