用于提取文件文本的数据挖掘工具

aTXT的Python项目详细描述


ATXT

从文件中提取文本。文本挖掘工具。

PyPI Package latest releaseCode Quality StatusScrtinizer StatusPyPI Package monthly downloadsGitHub issues for python-atxt

使用量

您可以将atxt与他的名称包一起使用,也可以在控制台中使用2xt。为了 例如,如果要显示帮助用法:

aTXT -h
2txt -h

此外,您还可以运行图形界面(使用pyside):

aTXT -i

你应该这样:

GUI

注意:atxt总是为每个文件路径生成一个文件。

示例:

$ 2txt prueba.html
$ 2txt prueba.html -o
$ 2txt --file ~/Documents/prueba.html
$ 2txt --file ~/Documents/prueba.html --to ~/htmls

在深度超过~::

的二级中搜索所有可文本文件
$ 2txt ~ -d 2
$ 2txt --path ~ -d 2 --format 'txt,html'

安装

pip install atxt

检查相关性以避免意外:

aTXT --check

要求

由于其他开源项目,此软件可用。这个 下面的列表列出了一些更难安装的组件:

  • pyside(gui lib)
  • 细分OCR
  • xpdf
  • Scandir(快速传送个人文件夹)

meta

  • 作者:Jonathan S.Prieto C.
  • 电子邮件:prieto.jona@gmail.com
  • 注:有反馈吗?请给我发一封电子邮件。
  • 免费软件:BSD许可证

问题

请随意评论 安装。http://github.com/d555/python-atxt/issues

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在表被注释到配置之前获取表的元数据?   java滚动条不会出现在JList上   java JOGL监视器GPU内存   java为什么要使用RecyclerView onDraw延迟   java定制Oppo Reno 2 Z CPH1951(手机型号)的固件(闪存文件)   java自定义线程池执行器   java如何解决发布版本中重复的jar条目[com/安卓/volley/R.class]?   java如何使用Bukkit API触发事件?   java在blazemeter jmeter RTE插件中使用ctrl+w输入   C#/Visual Studio的java JDT等价物   java为什么当maxread值很大而收到的消息数量很小时,卡夫卡消费者会无限期消费?   java游戏2。x:包含模板列表的绑定模型   带压缩的java日志旋转   运行时。exec用java运行程序读取它正在做什么