doi搜索和返回元数据

metadata-expander的Python项目详细描述


自动获取元数据条目

此存储库旨在作为从联机站点获取元数据的起点。

它将被集成到colli后端,用于协作文献管理。

安装

必须安装以下软件包:

Python3 美化组4 urllib语言库 python bibtexparser

在ubuntu下安装:

apt install python3 python3-bs4 python3-urllib3 python3-bibtexparser

或者,只需安装python3并通过pip从项目目录中执行其余操作:

pip install -r requirements.txt

添加更多站点。

如果没有特定站点的分析器,则可以在“站点”文件夹中创建它。

命名约定是,该文件中的文件名和类名必须是没有任何子域或顶级域的域名。 所以对于https://dl.acm.org/来说,就是acm

sites/example.py中提供了一个示例

每个类都必须是landingPage的子类,并且可以实现以下函数之一:

defgetBibTeX(self,link,soup):returnNonedefgetDict(self,link,soup):returnNone

在这两种情况下,参数都是doi解析器的登录页的url和被解析为beautifulsoup对象的页。

它们按其返回值分开。

getbibtex必须返回有效的bibtex条目或无。 getdict必须返回一个python字典,其中的字段名符合dublin核心标准。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java以编程方式最小化JInternalFrame?   java使用JsonPath将不均匀列表提取为类型化对象   spring如何将java/resources文件获取到InputStream?   Java逻辑错误并不总是存在   java Firebase,更新特定字段   Java stream groupby并同时加入以进行csv导出   java安卓:如果出现任何声音,监听器将录制声音   java如何从多个文件中轮询最后修改的文件并发送到apache camel中的目标端点?   java是否返回多个比较器?   JavaBean IO:Date MMM在CAPS中不解析   当JButton从另一个类单击时,java正在更新JLabel   基类中子类的Java泛型初始化   jakarta ee Java ee制作一个以毫秒为间隔的计时器来发送数据包   json Windows Azure日期格式转换为Java日期