一个简单的文本清理包,用于在NLP期间清理文本
textif的Python项目详细描述
文本化
一个简单的NLP文本清理和规范化包
安装
pip install textify
用法
清除文本
- 通过删除电子邮件、号码等清除文本
^{pr2}$
删除电子邮件、号码、电话号码
>>>docx.remove_emails()>>>docx.remove_numbers()>>>docx.remove_phone_numbers()
删除特殊字符
>>>docx.remove_special_characters()
替换电子邮件、号码、电话号码
>>>docx.replace_emails()>>>docx.replace_numbers()>>>docx.replace_phone_numbers()
使用文本提取器
- 从文本中提取电子邮件、电话号码、号码
>>>fromtextifyimportTextExtractor>>>docx=TextExtractor()>>>docx.text="your text with example@gmail.com goes here">>>docx.extract_emails()
由
- 杰西·阿格贝(JCharis)
- 耶稣救了我
NB
- 欢迎捐款
- 注意到一个错误,请告诉我们。在
- 非常感谢
标签:
- 项目
标签: