Gypse分析并显示您拥有的文本文件的信息。它识别诸如url、电子邮件和电话号码等难以提取的内容。

gypse的Python项目详细描述


https://travis-ci.org/aeroxis/gypse.svg?branch=masterhttps://media.githubusercontent.com/media/aeroxis/gypse/master/images/logo.png

什么是吉普赛?

你有没有试过在一堆文本文件中寻找有趣的东西,如url、电子邮件或电话号码? 这将变得非常艰难,非常迅速。可能会非常痛苦。

吉普赛是来帮忙的。你只需要用“pip”安装“gypsy”,让gypse查看你的文本文件。

https://media.githubusercontent.com/media/aeroxis/gypse/master/images/gypsy_screen_grab.gif

要求

Gypse需要Python3.4或更高版本才能正常工作

开始

pip install gypse

用法

吉普赛有一些样本数据,你可以克隆和玩。

git clone https://github.com/aeroxis/gypse /tmp/gypsy cd /tmp/gypsy gypse url-extractor ./samples/ –margins 5

这将产生如下结果:

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
字符串Java字母替换无效   java Spring Roo JPA MS SQL Server无法打开JPA EntityManager组织。冬眠例外GenericJDBCException:无法打开连接   在scala中使用JavaWS对大型数据文件进行java流式处理   Java编译器是否将字节和短字符识别为文本?   java无法查找符号错误,空指针   mongodb在Java中重用数据库连接   java将多个StringArray从字符串文件获取到活动中   java是一个变量,它只保存最后一次鼠标单击的坐标   c#尺寸有限;添加、删除和洗牌   java如何在Android中显示来自资产文件夹的文本文件中的文本   Android应用程序中的java Tensorflow Lite自定义对象检测模型错误   java如何在foreachloop中使用scanner将来自命令行的输入存储到数组中   java如何定义一个好的存储库接口   Android中的java解析动态json对象