匿名化ex中的数据

2条回答

网友

1楼 · 编辑于 2024-05-13 03:00:45

一旦您转换了excel文件中的数据（我个人没有太多的经验，但是我曾经使用过https://pypi.org/project/xlrd/），文本预处理过滤器可以帮助您匿名分析内容：textacy.preprocess.preprocess_textI.c.w.no_emails, no_phone_numbers，等等（https://chartbeat-labs.github.io/textacy/api_reference.html）

网友

2楼 · 编辑于 2024-05-13 03:00:45

以您喜欢的方式将数据读入python，然后使用正则表达式替换字符串。在

例如，您得到的列表中只有邮件地址r： r = "abc@gf.com"

现在您可以import re并使用re.sub()与合适的模式。对于我拿的邮件，One from regexr.com community整个事情可能是这样的：

import re r = "abc@gf.com" p = re.sub("[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?", "***MAIL***", r) print(p)

结果： >>> print(p) ***MAIL***

相关问题更多 >

编程相关推荐

热门问题

热门文章