快速文本处理

retexto的Python项目详细描述


# reTexto
Fast text processing for python

### Run

cd /[project_path]
docker build -t retexto .
docker run -v $(pwd):/retexto:rw -it retexto bash

### Test

invoke test

### Work in

docker run -v $(pwd):/retexto:rw -it retexto bash
invoke test

### 发布

调用publishtest…..一切都好吗?
invoke publish






>如果你的主要用途是什么,我需要这个www.google.com,我需要这个www.google.com,我需要这个www.google.com,我需要这个www.google.com,http://github.com<;br>;
<;strong>;用户名:arlos;lt;strong>;
我是来自佩劳尔的朋友,我来自佩劳尔的朋友。给jajajajaja发短信很有趣looveee thiis
@florenciaflor19 si!!!Sévo…胡安娜\
微笑!哈哈,jejeje jojojo jujuju jijijijajaja'

text=retext(s)
s=text.remove_html()\
.remove_insertions()\
.remove_tags()\
.remove_smiles(by='smileing')\
.convert_specials()\
.convert_emoji.remove_nochars(preserve_tilde=true)\
。remove_url()\
。remove_duplicate(r='a-jp-z')\
。remove_duplicate_元音()\
。remove_duplicate_辅音()\
。remove_标点符号()\
。remove_multispaces()\
。lower()\
。删除stopWords()\
。拆分单词(uniques=true)
打印
['username'、'from'、'love'、'i'、'ned'、'funy'、'juana'、'vo'、'this'、'si'、'im'、'se'、'peru'、'smile'、'so'、'smile'、'carlos']

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java素数校正(2个数组)   java是否可以将ArrayList除以一个double并创建一个新列表?   列出Java类Java的消息体编写器。util。ArrayList   Java将管道分隔文本\csv文件转换为XML   JAVA木卫一。IOException:读取Transferncode时EOF过早:分块http响应   java Volatile变量的读写   java错误:类型不匹配:无法从ArrayList<Subchild>转换为ArrayList<String>   java:无法向AsyncLoadingCache提供CacheWriter   java多级listview Android Studio   静态Java哈希映射性能   循环如何在JAVA中创建三角形   java在春季为ContextFactoryBean定义多个contextPath路由   java从服务器的URL下载数据,并将其保存在一个私有的安全文件夹中   JavaSpringJPA查询   objective c Java REST服务二进制下载   使用JavaSpringRESTAPI并将记录插入mysql表   java你会选择一个算法的速度而不是它对内存的有效使用吗?   java通过多个字段比较对象,如何添加一个方法?   java在spring框架上使用@ModelAttribute(“myobject”)访问服务器上的JSON