聚合物理文献的Python工具
pheed的Python项目详细描述
聚合物理文献的Python工具
pheed
(physicsfeed)包从各种在线来源收集物理文献元数据并进行规范化
将生成的数据转换为标准格式。这个包提供了三个主要的数据结构。简单的总结,
一个Source
产生并Article
,其中Author
。可以从给定的源搜索新文章
一些时间和分类信息,如“本周新消息”或“量子引力”,以及寻找新的信息
特定作者的文章。在有官方api的地方,我们就使用它们,否则我们就求助于web抓取。作为一个
因此,文章的pdf格式可能并不总是可用的。我们的目标是在可能的情况下添加这些功能
同时尊重相关来源的条款和条件。该包尚未添加对的显式支持
非同行评议的来源,例如博客,尽管我们意识到这些在社区和
将来可能会增加支持。在
主体结构
下面概述了pheed
包的关键组件,并定义了一些相关的属性或用途
每一个。下面的示例将解释每个组件的用法。在
Source
:物理文章的在线来源- ^{pda}通常由一些元数据组成
Author
:对Article
的贡献者,具有预期的属性(名称等)
包装的源
尽管pheed
包包含包装附加源所需的所有工具,
已经包装好了几个来源:
- APS日记账
- IOP日志
- 阿尔十四
- 项目
标签: