分析医院事件、处方和类似类型健康数据的工具
snotra的Python项目详细描述
snotra-使用熊猫和python进行健康注册研究
snotra是一个扩展和建立在pandas库基础上的工具,它可以更容易地分析医院事件、处方和类似类型的健康数据。
斯诺特拉也是一位北欧智慧女神。
示例
统计事件数据中具有诊断的唯一人员的数量
- 使用特殊符号(星形、连字符和冒号)
df.count_persons(codes=['K50*','K51*'],cols='icd*')df.count_persons(codes=['K50.0-K51.9'],cols='icd*')
- 使用逻辑表达式
df.count_persons(codes='K50 or K51 and not K52',cols='icd*')df.count_persons(codes='K50 in: icd and 4AB02 in:atc1, atc2')
为某些使用代码列表或逻辑表达式的人选择所有事件
df.select_persons(codes=['K50*','K51*'],cols='icd')df.select_persons(codes='(K50 or K51) and not K52',cols='icd')
计算每个单元格中有多个值的多列中的唯一代码数
df['icd_primary','icd_secondary'].count_codes(sep=',')
计算查尔森共病指数*
cci=sa.charlson(df=df,cols=['icd1','icd2'],sep=',')
安装
我们建议使用“sa”作为snotra的缩写
pipinstallsnotraassa
要求
- python 3.6
- 熊猫
许可证
麻省理工学院
文档
方法和函数概述草案doc
免责声明
斯诺特拉目前正在开发中,尚未准备好生产。还有很多东西需要测试和修正,使用风险由你自己承担-欢迎贡献!
功能
处理医疗代码的简单有效的符号和方法:医疗数据通常使用特殊的代码系统来指示诊断、药物和医疗程序。我们整合了这些工具,并允许使用不同类型的符号(星号、连字符、冒号),以便于选择或计算相关患者。
使用事件级数据回答个人级别的问题:通常健康数据包含有关事件(处方、住院)的信息,而我们希望回答的问题同时在事件级和个人级别:
- 事件级别:一年中使用多少剂量的某种药物?
- 人员级别:有多少人接受过某种药物?
我们有一些方法,比如
count_persons
,这些方法可以很容易地从事件级数据中获取人员级的答案。
处理凌乱的数据:有时提供给分析的文件是多个凌乱的管理数据大文件。例如,过程代码可以合并在一列(逗号分隔)中,也可以分散在许多列中。为了处理这个问题,我们有接受这两种类型数据的方法。例如:方法
count_codes()
可以计算许多列中的代码,其中有些列可能包含逗号分隔的代码,有些列可能是单值的。