数据集中的pii分析

piianalyzer的Python项目详细描述


PII分析器分析数据集中的PII使用其他信息来识别、联系或定位单个人员,或在上下文中识别个人。


然后,该工具应提醒HDX数据管理器是否已上载任何此类数据集
,并提醒数据所有者有关此信息。

以上任务:

1.` pandas<;https://github.com/pydata/pandas>;``用于将数据文件读入python并操作数据集。

2.`常用正则表达式<;https://github.com/madisonmay/commonregex>;``用于提取某些类型的“PII”,如电子邮件地址、电话号码、街道地址、
信用卡号码、


3。`斯坦福命名实体标记器<;http://nlp.stanford.edu/software/crf-ner.shtml>;``用于提取位置、组织和人员名称。




分析它并返回所提供数据集中的数据类型的摘要。
使用此信息,数据管理器可以轻松地对数据进行分类。



piianalyzer=piianalyzer(文件路径)
>;>;analysis=piianalyzer.analysis()





installation
----




requirements
^^^^^^^^^^^^^^^^^^^

需要斯坦福命名实体识别器。可下载下载网址:http://nlp.stanford.edu/software/crf-ner.shtml






















>








标签:

  • 数据
  • https
  • lt
  • gt
  • 信息
  • pandas
  • 管理器
  • 人员
  • pii
  • 欢迎加入QQ群-->: 979659372 Python中文网_新手群

    推荐PyPI第三方库


    热门话题
    在java Swing中检测重叠对象   java JAXB,xs:any和targetNamespace   JavaFX中的java按钮操作以错误的顺序执行   java Android显示所有已安装应用的应用选择器   在Java中,有没有比仿射变换更有效的旋转图像的方法?   java Play 2.4.6,为测试中的字节码增强配置生成设置   java无法在片段中的图像滑块中获取图像   在java中尝试MD5哈希   Android studio应用程序能否读取Java桌面应用程序序列化的数据类?   无法强制转换java自定义类   自定义Arraylist中的java Split 2列csv字符串   java Spring自定义请求上下文   java在安卓应用程序运行期间,如何检查网络状态是否发生变化?   java是否应该更改HTTP客户端以获得来自服务器的异步响应?   java使用TableModel来保存和处理数据,或者让它只显示对象(内容)   java如何获取麦克风/扬声器名称?   java Android从另一个类更新布局   通过Java RXTX与空调制解调器进行串行到串行通信?