健壮易用的通用dicoms匿名化器与人口统计csv电子表格通过散列id匿名化
csg-dicoms-anonymizer的Python项目详细描述
用法
要使用此应用程序,必须指向每个子文件夹都是患者DICOM会话的文件夹。如果是针对同一患者,则可以放置多个dicom会话。这是因为脚本假设每个文件夹中有一个病人(要查找姓名,否则查看所有dicom文件的成本太高)。
或者,您可以提供csv格式的人口统计文件,将其与dicom一起使用相同的假名进行假名化。此csv文件必须至少包含一列"名称",其中包含所有患者的姓名。排版和单词顺序无关紧要,因为会有一个模糊的匹配。但是,请注意,如果某些名称太相似,或者输入错误太多或缺少中间名,这种模糊匹配可能无法正常工作。模糊匹配可以通过"dist_threshold"参数进行调整。
最后,还有多个额外的选项来提高化名的效率,例如,有一些文件类型的黑名单可以删除,其中可能包含可识别的信息(pdf、csv、txt等),这些信息可能是实验者留下的,还有一个d要完全删除的ICOM字段(例如PatientPhoneNumber)。
此应用程序可以与图形用户界面或命令行互换工作,同样的功能和选项将可用。
另一个有趣的特性是,可以在匿名数据集的基础上构建,还可以添加新的主题。实际上,每个受试者都会根据姓名(默认情况下)或文件夹中的顺序(通过使用适当的选项)获得唯一的ID,这使得在任何情况下都无法从ID转换回原始姓名。