用于替换、删除或加密包含个人识别信息(PII)或受保护健康信息(PHI)的数据帧或序列的熊猫访问器

clean-pandas的Python项目详细描述


清洁熊猫

用于替换、删除或加密包含个人识别信息(PII)或受保护健康信息(PHI)的数据帧或序列的熊猫访问器

依赖关系

安装

pipinstallclean_pandas

清洁类型选项

  • encrypt(默认)-使用cryptography库并使用fernet(对称加密)
    • 注意:必须在结束repl或程序之前使用serialize_encryption_key,才能解密
  • faker-使用Faker库,并要求用户表示要使用的伪造者“fake”
  • scrubadub-利用Scrubadub库检测和替换pii
  • truncate-如果可能,通过强制转换为字符串来截断数据,如果可能,则重新转换为原始类型。如果截断长度大于值长度,则返回None。如果不能转换回原始类型,则返回字符串值

基本用法

>>>fromclean_pandasimportCleanPandas>>>importpandasaspd>>>test_df=pd.DataFrame({"first_name":["Charles","Stephen"],"last_name":["Darwin","Hawking"],"ssn":["555-55-5555","123-45-6789"]})>>>result_df,encryption_key,dtype_dict=test_df.clean_pandas.encrypt('ssn')>>>result_df['ssn']0b'gAAAAABbextrtJcQfOt37HK7pEISBokuh9ndWwGhvZpv...1b'gAAAAABbextrHo7qFr6DIZ0FlvVyO73HOmOYujKsv6vS...Name:ssn,dtype:object>>>test_df.clean_pandas.fake_it('last_name',faker_type='first_name')['last_name']0Joshua1MichaelName:last_name,dtype:object>>>test_df.clean_pandas.scrub_it('ssn')['ssn']0{{SSN}}1{{SSN}}Name:ssn,dtype:object>>>test_df.clean_pandas.truncate('ssn',trunc_length=7,trunc_from_end=False)['ssn']0555516789Name:ssn,dtype:object# Decrypt a series>>>result_df,encryption_key,dtype_dict=test_df.clean_pandas.encrypt('ssn')# encrypt>>>test_df.some_id0b'gAAAAABblA1SIGqKbTC97RjEibmB4FBHnXqKVocvFMg4...1b'gAAAAABblA1Sc_StggFPj0zmQLUVo0ADqHQtljUEGcr0...Name:some_id,dtype:object# Automatically casts back to original dtype with optional dtype argument>>>result_df.clean_pandas.decrypt('some_id',encryption_key,dtype_dict)['some_id']0112Name:some_id,dtype:int64

许可证

麻省理工学院许可证

版权所有(c)2018 Aaron Burgess

兹免费准许任何人取得副本 本软件和相关文档文件(“软件”)的 在软件中不受限制,包括但不限于 使用、复制、修改、合并、发布、分发、再授权和/或出售 软件的副本,并允许软件的用户 在满足以下条件的情况下,可以这样做:

上述版权公告及本许可公告须包括在 软件的拷贝或大部分。

本软件按“原样”提供,无任何形式的保证,明示或 默示的,包括但不限于适销性保证, 适合特定目的和不侵权。在任何情况下 作者或版权所有者应对任何索赔、损害或其他 责任,无论是在合同诉讼、侵权诉讼或其他诉讼中, 不属于或与本软件有关,或使用或与本软件的其他交易有关。 软件。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java创建猜谜游戏程序   JavaWebSocketContainer。connectToServer似乎挂起了   如何在java中中断函数   java c#socket client multiple BeginSend()未到达服务器   不可见的组件然后在Java中的窗格之间切换   java在应用程序类中使用静态接口安全吗?   java等待函数完成,直到回调到来   使用DataOutputStream时的java新行,Android   java服务对象的定义是什么?   基于视图的javahibernate复合密钥   java将varchar连接到char在JPA(oracle)中不起作用   如何在java中通过point类读取多个点?