退伍军人事务部生物监测中使用的COVID19监测NLP管道。

cov-bsv的Python项目详细描述


弗吉尼亚州科维德-19

退伍军人事务部生物监测中使用的COVID-19监测NLP管道。 这个系统在A Natural Language Processing System for National COVID-19 Surveillance in the US Department of Veterans Affairs中描述 作为ACL COVID-19 Emergency Workshop的一部分。在

我们的系统是作为弗吉尼亚州应对COVID-19大流行的一部分而部署的,它帮助确认了大量病毒 全国退伍军人协会医疗系统中的COVID-19例。在

免责声明

这个资料库并不意味着是一个完整的,最终确定的系统检测COVID-19在临床文本。 它是美国退伍军人事务部为一个具体的行动目标而开发的。但是,性能会有所不同 基于你的数据和用例。这也不是上述文件中描述的确切系统-它已被修改并 简化为一般化,而不是对VA数据非常具体。在

您可能需要根据您的数据和需求定制管道。但希望我们能做到这一点! ./notebooks中的教程演示了每个组件的工作原理、如何添加新规则以及如何删除/添加 到管道的组件。在

概述

此存储库实现了A Natural Language Processing System for National COVID-19 Surveillance in the US Department of Veterans Affairs中描述的系统版本。 这是在acl2020紧急COVID-19研讨会上提出的。你可以在YouTube上找到recorded presentation。在

NLP系统被设计成spaCy处理管道。大多数组件作为 medSpaCy包。在

alt text

管道由以下主要部件组成:

  1. 从medSpaCy导入的定制组件
  2. 一种文档分类器组件,它分配属性doc._.cov_classification,该属性指示文档是否 “POS”“UNK”,或“NEG”
  3. 包含添加到组件中的规则的知识库,用于控制提取哪些实体和什么 属性已分配

使用

详细的教程和解释在./notebooks中提供。谷歌Colab笔记本也提供:

安装

您可以使用pip安装cov_bsv

$ pip install cov-bsv

或者通过克隆此存储库并使用setup.py进行安装:

^{pr2}$

安装完所有依赖项后,您将需要安装spaCy语言模型en_core_web_sm

$ python -m spacy download en_core_web_sm

cov_bsv需要Python>;=3.6

快速入门

下面是一个简单的示例,它获取一个临床文本,加载一个带有知识库的管道,并处理文本。 然后,我们可以使用可视化技术检查从文本中提取的文档分类和语言模式 来自cov_bsvmedspacy的函数。在

importcov_bsvnlp=cov_bsv.load(model="default",load_rules=True)text="""Patient presents to rule out COVID-19. His wife recently tested positive for novel coronavirus.​COVID-19 results pending.​"""doc=nlp(text)cov_bsv.visualize_doc(doc)

alt text

frommedspacy.visualizationimportvisualize_depdoc=nlp("His wife recently tested positive for novel coronavirus.​")visualize_dep(doc)

alt text

联系方式

如果您有任何问题或意见,或者您已经应用NLP来帮助抗击COVID-19大流行, 我们很想听到你的消息!请随意使用下面的联系方式联系。在

引用这篇文章

您可以使用以下BibTex引文引用这项工作:

    title = "A Natural Language Processing System for National {COVID-19} Surveillance in the {US Department of Veterans Affairs}",
    author = "Chapman, Alec  and
      Peterson, Kelly  and
      Turano, Augie  and
      Box, Tam{\'a}ra  and
      Wallace, Katherine  and
      Jones, Makoto",
    booktitle = "Proceedings of the 1st Workshop on {NLP} for {COVID-19} at {ACL} 2020",
    month = jul,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.nlpcovid19-acl.10",
    abstract = "Timely and accurate accounting of positive cases has been an important part of the response to the COVID-19 pandemic. While most positive cases within Veterans Affairs (VA) are identified through structured laboratory results, some patients are tested or diagnosed outside VA so their clinical status is documented only in free-text narratives. We developed a Natural Language Processing pipeline for identifying positively diagnosed COVID19 patients and deployed this system to accelerate chart review. As part of the VA national response to COVID-19, this process identified 6,360 positive cases which did not have corresponding laboratory data. These cases accounted for 36.1{\%} of total confirmed positive cases in VA to date. With available data, performance of the system is estimated as 82.4{\%} precision and 94.2{\%} recall. A public-facing implementation is released as open source and available to the community.",
}```

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何强制用户在允许访问活动之前处理对话框?我的许可证代码怎么了?   java ArraysList作为JSON   mysql如何在java中创建包含多个可选where子句的搜索语句?   java如何让Apache Camel在“直接”路径的末尾删除文件?   使用socket在两个Androids之间进行java实时数据传输。IO(websocket)和4G   如何在java中实现两个CORBA服务器之间的通信   会话树xml表示为java对象   java Skype4Java编号swtwin323325   java RecyclerView getAdapterPosition()不工作:第一次单击返回正确位置,第二次单击返回1   java在$TOMCAT/conf/context上为JNDI设置资源。xml   java为什么第二个矩形冲突在第一个矩形冲突时不起作用?   JScrollPane上的java JTextArea未出现在JPanel上   java如何将实现的PriorityQueue打印为字符串?   jpa使用Jersey更新用户角色RESTJava(JAXRS)