用于文本生成器的一个小模块,用于筛选字符串中的错误单词。

wordfilter的Python项目详细描述


用于文本生成器的一个小模块,用于筛选 坏单词的字符串。

开始

pip install wordfilter

安装模块
>importwordfilter>wordfilter.blacklisted("does this string have a bad word in it?")False# add new words>wordfilter.add_words(["zebra","elephant"])>wordfilter.blacklisted("this string has zebra in it")True# remove a word>wordfilter.remove_words('zebra')>wordfilter.blacklisted('this string has zebra in it')False# clear the list entirely>wordfilter.clear_list()

文档

这是一个单词过滤器,改编自我在 推特机器人。它基于a list of words that I’ve hand-picked 排除在我的机器人之外:本质上,它是一个 不会说我自己。一般来说,它们是 “压迫”、“种族主义”、“性别歧视”之类的话我都不会说。

这个清单并不包罗万象,我总是在上面加上一些词。如果 您想提交问题或请求添加更多单词,请 这样做,但要明白这主要是用于我自己的项目, 我可能不同意加上某些词。(例如,我没有 有点伤脑筋,所以“狗屎”和“狗屎”永远不会出现 此列表。)

单词不区分大小写。

也注意到,由于英语的复杂性,我是 考虑任何包含坏单词的子串的内容 列入黑名单。例如,即使“同质”不是一个坏词,但是 包含子字符串“homo”并进行筛选。原因是 新俚语总是用复合词出现而我不能 可能跟得上。我愿意说几句 “同质”和“巴基斯坦”,以避免假阴性。

贡献

代替正式的形式指南,注意维护现有的 编码方式。为任何新的或更改的功能添加单元测试。绒布 并使用Grunt测试代码。

许可证

版权所有(c)2013 Darius Kazemi
根据麻省理工学院许可证获得许可。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何在Eclipse中设置Java路径,以便在外部驱动器上运行它?   在windows上使用Java服务包装器GUI与桌面交互   java是与此字符序列不匹配的正则表达式   java无法使用kafka管理客户端API创建具有所需分区的kafka主题   java基于单个单元格值获取整个excel行   当使用Spring的构造函数注入时,java bean是否在构造函数中完全初始化?   java重置LineNumberReader的计数器   将字符串从Java文件传递到jQuery   安卓在来自不同Java类文件的活动中祝酒   java在使用mvvm时如何在zk中更新progressmeter   使用regex获取由“”Java包围的值   使用tester类的java猜谜游戏   api响应的java POJO,其密钥为“”   java正则表达式,用于匹配长度大于n的字母和数字字符串?   java如何使用Json保存和恢复RecyclerView项的位置   在Java中用字符代码替换字符串   Jenkins中的java PermGen错误   java swing panel问题   boolean在Java中,false如何可能等于true   java如何使用Servlet从HTML表单中检索“分组”项?