从csv文件中删除包含黑名单单词的行。

csvcleaner的Python项目详细描述


CSV Cleaner是一个Apache 2.0许可的Python库,它删除行 包含CSV文件中的黑名单单词

说明

`python >>> import csvcleaner >>> f = csvcleaner.CSVCleaner() >>> f.run('/path/to/file.csv') `

当调用run时,csv cleaner将遍历csv文件中的每一行并搜索黑名单中的单词。

当一行因为包含黑名单单词而被拒绝时,它将被移到[name]-rejected.csv文件中。接受的行被移动到[name]-accepted.csv文件两个文件与原始csv文件保存在同一目录中。

安装

要安装csv cleaner,只需运行:

`bash $ pip install csvcleaner `

参数

CSVCleaner接受几个参数:

`python >>> import csvcleaner >>> f = csvcleaner(blacklist=[],replace_chars=[], configure=True, lowercase=True, strict=False) `

####黑名单

用于确定行是否被拒绝的字符或单词的list

默认值:[](除非configureTrue

更换字符

一种list的单词或字符,用空格代替,以使单词检测更准确和有效。

默认值:[](除非configureTrue

配置

True时,csv cleaner将为blacklistreplace_chars使用推荐列表。只有在类实例化期间写入blacklistreplace_chars或包含空列表时,才会使用这些建议的列表。如果要为blacklistreplace_chars提供自定义列表,请设置为False

默认值:True

####小写

True时,所有字符和字符串都将转换为小写,以便更准确地检测单词。当一行插入[name]-accepted.csv[name]-rejected.csv时,它的原始大小写将保留。如果大小写匹配很重要,请设置为False

默认值:True

严格的

True时,可能包含(例如,模糊匹配)黑名单单词或字符的行将被拒绝。

默认值:False

黑名单

csv cleaner包含一个黑名单,当configureTrue并且 blacklist为空。这个黑名单由[shutterstock]维护(https://github.com/shutterstock/) 在[github](https://github.com/shutterstock/List-of-Dirty-Naughty-Obscene-and-Otherwise-Bad-Words)上。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何将jaxb插件扩展与gradlejaxbplugin一起使用   java Hibernate列表<Object[]>到特定对象   java使用多态性显示arraylist的输出   java水平堆叠卡,带有一定偏移量   java错误:找不到符号方法liesInt()   java客户机/服务器文件收发中的多线程流管理   在java中可以基于访问重载方法吗?   包含空元素的java排序数组   swing Java按钮/网格布局   java BottomNavigationView getmaxitemcount   java空指针异常字符串生成器   java Xamarin升级导致“类文件版本错误52.0,应为50.0”错误   java我正在尝试打印它,而不只是对每一行进行println   Tomcat7中的java是否需要复制上下文。将xml转换为conf/Catalina/locahost以使其生效   带有注入服务的java REST端点在何处引发自定义WebServiceException?   在Java中使用GPS数据   java如何将JFreeChart ChartPanel导出到包含添加的CrosshairOverlay的图像对象?   内置Eclipse期间的Java 8堆栈溢出   java在GWT编译的JavaScript中如何表示BigDecimal