negbio:否定与不确定度检测工具
negbio的Python项目详细描述
negbio是一个高性能的nlp工具,用于在临床文本(如放射学报告)中进行否定和不确定性检测。
开始
安装Negbio
从源安装(推荐)
$ git clone https://github.com/ncbi-nlp/NegBio.git $ cd /path/to/negbio $ python setup.py install --user $ exportPATH=~/.local/bin:$PATH
从PIP安装
$ pip install negbio
准备数据集
输入可以是纯文本或BioC格式。 如果报表是纯文本的,则每个报表都需要位于单个文件中。 可以在examples文件夹中找到一些示例。
运行脚本
有两种方法可以运行管道。
note:如果要处理大量报告(例如,>;1000),建议分步运行管道。 见User guide。
使用chexpert算法
如果要使用CheXpert方法,请运行以下行之一
$ main_chexpert text --output=examples examples/00000086.txt examples/00019248.txt
$ main_chexpert bioc --output=examples examples/1.xml
使用元映射
如果要使用元映射,请使用实际的absolute替换<METAMAP_BINARY> 路径,例如meta_map_home/bin/metamap16
$ main_mm text --metamap=<METAMAP_BINARY> --output=examples examples/00000086.txt \ examples/00019248.txt
$ main_mm bioc --metamap=<METAMAP_BINARY> --output=examples examples/1.xml
引用negbio
如果您正在运行negbio管道,请引用:
- 彭勇,王X,鲁L,巴格丽M,萨默斯RM,鲁Z.NegBio: a high-performance tool for negation and uncertainty detection in radiology reports。AMIA 2018信息峰会。2018年。
- 王X,彭Y,鲁L,巴格丽M,鲁Z,萨默斯R.ChestX-ray8: Hospital-scale Chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases。 ieee计算机视觉与模式识别会议(cvpr)。2017年,2097-2106年。
致谢
这项工作得到了国家卫生研究院、国家图书馆的内部研究项目的支持。 医学和临床中心。
我们感谢negex、metamap、stanford corenlp、bllip parser和chexpert labeler的作者 他们的软件工具是公开的。
我们感谢Alexis Allot博士的有益讨论。免责声明
这个工具展示了计算生物学分支NCBI的研究结果。产生的信息 在本网站上,未经审查和监督,不得直接用于诊断或医疗决策 一个临床专家。个人不应该仅仅根据信息改变自己的健康行为 制作于本网站。NIH不独立地验证所产生信息的有效性或实用性 用这个工具。如果您对本网站提供的信息有任何疑问,请参阅医疗保健 专业的。有关NCBI的免责声明策略的更多信息可用。