用于格式化发布数据和从pubmed的entrez工具访问数据的工具包
pub.tools的Python项目详细描述
简介
可用工具:
- entrez-简化生物技术
- 引文-使用IMS标准为6种不同类型创建引文
- 日期-将日期格式化为所需格式
- 消毒剂-主要用于强制python2中的unicode遵从性
引文
引文基于pubmedhttps://www.ncbi.nlm.nih.gov/books/NBK7256/定义的标准。 对于某些发布类型,传递带有true值的italicize参数将返回 带有斜体标记的日志或会议名称的HTML。
日记账
日志模块使用pmc源文件https://www.ncbi.nlm.nih.gov/pmc/journals/?format=csv 构建
更改日志
[3.0.1]-2019年8月22日
- 日志模块重新配置为在启动时不写入磁盘
[3.0]-2019年8月12日
- 独家支持Python3
[2.1]-未发布
- 用抽象行为重新设计引文。
- “italicize”选项已替换为“html”选项,不会进行任何安全转义
- 将docstring添加到引文函数中
[2.0.2]-2019年1月25日
- 还原safe_unicode用法,但仅适用于python 2。在python 3中不是问题
- 如果使用“escape”参数,则取消对除title和abstract之外的所有字段的scape。这两个字段被视为html 如果escape为false,则所有其他字段均为纯文本
[2.0]-2018年10月17日
- 支持Python2和3的六个实现[hoskins]
[1.7]-2018年5月10日
- 重构一些entrez函数,使api端点更加明显
- 将所有预期端点函数的docstring转换为rest
- 添加按pmc id查找发布的功能。这是通过查询pmc数据库完成的
- 重构稍微生成搜索查询
[1.6]-2018年3月1日
- 修复了book rest api调用以允许失败
- Book Rest API调用现在使用请求模块
- isbndb.com数据库现在只提供付费服务。它应该可以工作,但我没有服务来验证这一点
[1.5]
- 引用现在可以作为纯文本生成,而无需在日志等上添加标记。它默认为true 但在以后的版本中将默认为false。
- 从引文函数中删除了一些未使用的参数
- 已清理单元测试
- 修正了引文中的收集日期问题
[1.4]
- 重构和重新格式化PEP8