在XML和JSON文件中混淆和屏蔽元素的实用程序

PARANOID的Python项目详细描述


#XML和JSON屏蔽

有关详细信息,请访问https://sonra.io/2019/04/01/paranoid-masking-anonymizing-and-obfuscating-pii-in-xml-and-json-data/

##关于

paranoid是用于xml和json文件格式的数据屏蔽和混淆命令行工具。偏执狂最常用于 与屈肌结合。flexter是sonra基于行业数据的复杂xml和json的xml转换器。 acord、hl7、fhir、ndc、xbrl、fpml等标准,将xml转换成任何关系数据库, hadoop格式(orc、parquet、avro、hive、impala)或文本(tsv、csv)。

##功能

  • 可用于一个或多个XML/JSON文档。如果输入路径指向目录,则递归处理其内容。自动检测每个文件的格式。
  • 默认情况下,屏蔽xml/json文档中的所有元素/属性,同时保留文件的确切结构。
  • 还可以只屏蔽xml/json文档中的特定元素(通过提供的路径/xpath)。
  • 通用:在python 2.6+或3.6+上运行
  • 脱机工具-在系统上本地运行。任何地方都不会传输数据。
  • 开放源码-任何人都可以检查它所做的工作,以确保数据在离开香肠机后不能成功地反编码回来。欢迎任何贡献!
  • 易于安装-可以下载脚本本身或使用pip

##高级功能

  • 自定义构建的解析器-只做需要做的事情的简单解析器。消除了使用外部libs的开销。很快。它不验证文档,因此可以在某种程度上处理一些边缘粗糙的文档。
  • 智能缓冲-内存简单(可重新定义的缓冲区使用,默认为2 MB),但同时适用于大文件(如10 GB)。即使所有内容都集中在一行中,也可以使用它们! *屏蔽统计信息-提供在操作期间屏蔽的XML标记数和标记数的统计信息,也可以将这些标记存储在日志文件中。

##建筑 Architecture

##安装

###pip install PARANOID

#说明

用法:paranoid [-h] -i INPUT [-b BYTESIZE] -o OUTPUTDIR

数据屏蔽

可选参数:

^ {CD4>}显示此帮助消息并退出

-i INPUT输入目录名/文件名

-b BYTESIZE(re)定义缓冲区大小(默认为2mb)

-o OUTPUTDIR输出目录名

paranoid -h

Usage

##用法示例

屏蔽单个文件

paranoid -i <input filename> -o <output directory name>

SingleFile

屏蔽目录中的所有xml和json文件

paranoid -i <directory name> -o <output directory name>

MultipleFile

更改缓冲区大小

paranoid -i <File or directory name> -o <output directory name> -b buffersize

BufferLimit

在分析文件时,这是通过逐字节、逐缓冲区地对文件进行流式处理来吸收大容量单行代码的方法。

屏蔽某些标签

paranoid -i <input filename> -o <output directory name> -l xpath separated by ,

SpecificTags

生成日志文件

paranoid -i <input filename> -o <output directory name> -L Log File Location

Generate Log File

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java web爬虫:使用selenium+webdriver遍历页面链接时出现两种异常   java JPA和SYS_REFCURSOR-like OUT参数   非空参数的java方法引用?   xml中的java子节点名称   java为什么GC不在同一个方法中运行   java如何检查可执行JAR是否已在另一个JVM中完成   将外观更改为Nimbus后出现jtable Java错误   用户界面Java Swing架构问题?   java导入自定义字体时我做错了什么?   java如何用API制作可伸缩的游戏策划   java玩家和方块的碰撞和交集   java增强的for循环   java propertiesmavenplugin不适用于目标writeprojectproperties   java循环返回代码的开头   java使用分号执行apachecommonsexec多个命令   Wicket应用程序中的java全局可访问资源   java在eclipse中设置参数时可以使用类名而不是id吗?   eternal和maxElementsInMemory在ehcache中的java角色?   java ClassCastException在同一个ear中从两个不同的WAR加载同一个类时,由于类装入器不同