封装到掩码pd.数据帧数据

zorro-df的Python项目详细描述


codecov

zorro logo

佐罗DF

zorrodf是一个python包,用于屏蔽pandas数据帧对象,以便 匿名化数据。它允许您去掉可识别的列名和字符串 值,将其替换为通用命名约定。程序包已生成 在scikit learn transformer框架下,因此可以插入任何 scikit学习管道。在

包源代码可以在http://github.com/epw505/zorro_df

入门

要求

pandas>=0.25.3
scikit-learn>=0.22.1

安装

Zorro DF可以使用pip和以下命令进行安装:

^{pr2}$

示例

一旦安装了包,就可以将zorrodf加载到python会话中 并使用Masker对象来屏蔽数据。在

from zorro_df import mask_dataframe as mf

example_masker = mf.Masker()
example_masker.fit(data)
masked_data = example_masker.transform(data)

测试

zorrodf的测试套件是使用pytestpytest-mock构建的 插件。按以下步骤安装两个。在

pip install pytest
pip install pytest-mock

一旦安装了测试套件,就可以从的根目录运行测试套件 佐罗Df。在

pytest tests/

未来发展

  • 恢复原始数据屏蔽
  • 附加数值缩放技术

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java重写父类中的特定行   java Apache Commons CLI订购帮助选项?   java如何将数据添加到网格视图   java如何在Apache Camel批处理后移动文件?   java如何为日期范围的between子句编写hql查询?   雅加达ee开始Java编程,我应该从哪里开始?   排序Java8+流:检查我的objectinstances的两个字段的列表顺序是否正确   java如何将json转换为Map<String,Object>确保整数为整数   java不能在Spring数据JPA批处理过程中创建TransactionException   java损坏的PDF文件从FTP下载到使用Apache Common Net的设备   java无法使用Spring批处理和Wso2为XML架构命名空间找到Spring NamespaceHandler   java Android ImageView未显示在SherlockFragment中   Maven在构建时出错=无法识别Java路径   java如何使用批处理文件调用关闭处理程序?   java admob广告横幅重叠我的游戏屏幕安卓