检测俄语文本中的脏话并对其进行处理

djantimat的Python项目详细描述


detect dirty slang in russian text and process it.<

>当然,打击俄语非规范词汇是非常困难的,<
,而这个模块并不要求一个单一的胜利,但在这场斗争中,它可以帮助


。在不同的时间,在一个被遗忘的网站上的单词列表和正则表达式,作为模块的基础,
,如果有人发现自己的作者,
,我很高兴是一个作者来指定或删除的propertrials部分的要求。

>模块的基础是两个原则
>通过pymorphy2
https//pypi.python.org/pypi/pymorphy2/<
与预先准备的数据库的比较<
*基于正则表达式的文本分析。<


>可以使用任何一种或另一种方式。<

。选项工作速度更快,但不准确。但它的作品以外的Django。
,第一个版本是缓慢的,但它很容易训练,添加单词到列表。
。第一个版本也可以使用以外的Django,但你必须自己去清理数据库
联合国日刊:www.un.org/Docs/journal/Ch/latestc.pdf www.un.org/Docs/journal/Ch/latestc.pdf www.un.org/Docs/journal/Ch/latestc.pdf www.un.org/Docs/journal/Ch/latestc.pdf www.un.org/Docs/journal/Ch/latestc.pdf www.un.org/Docs/journal/Sp/latestc.pdf www.un.org/Docs/journal/Sp/latestc.pdf www.un.org/Docs/journal/Sp

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
正则表达式Java使用关键字拆分字符串   Neo4j Java API模式索引范围查找?   java访问JButton[]   java如何混淆tomcat日志文件中的请求属性   apache运行CGI Java程序   java从一个Eclipse插件开始,我如何通过编程使Eclipse编辑某个文件?   从php中的SQL数据库到Java中的多个值作为单独的变量   java如何在多个osgi捆绑包之间共享资源   datetime Java time,无法从历元秒解析年份   java无法在安卓应用程序中使用morpho指纹扫描仪设备捕获指纹   java使用groovy/ratpack发送电子邮件   javascript在jsp页面中添加验证,但在控制台中仍然显示一些错误   java如何修复com。mysql。jdbc。DocsConnectionPropsHelper   java AlertDialog dispatchTouchEvent