从网站上搜集生物数据

bioscraping的Python项目详细描述


#生物废料

用python编程与远程数据库交互的web scraper 使用sqlite3对web数据进行本地缓存,以防止过多的web 交通。

到目前为止,已实现:

  • [uniprot](http://uniprot.org)由uniprot蛋白id(例如'q8bp71')
  • [公共医疗](www.ncbi.nlm.nih.gov/pubmed/)按PMID(例如“24213538”)分类

#安装

##python 2.7.x和3.x pip安装bioscraping

#测试

没有真正的单元测试,但是您可以使用 python test/not_a_real_test.py

#用法

出版

来自Bioscraping Import PubMedClient

pubmed=pubmedclient()

默认情况下,将编写名为.bioscraping.pubmed.sqlite.db的文件。使用pubmedclient(“:memory:”)存储内存中的数据。

pubmed.fetch(<PMID>)

返回pmid的带author和abstract的文本。

##uniprot

from bioscraping import UniprotClient

uniprot = UniprotClient()

默认情况下是编写名为的文件。bioscraping.uniprot.sqlite.db。使用uniprotclient(“:memory:”)进行内存数据存储。

uniprot.fetch(<Uniprot ID>)

返回从XML解析的数据字典。

#买家当心

uniprotclient有一个潜在的竞争条件,tempfile需要 在对并发进程安全之前实现。(请参阅待办事项)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java连接在一个屏幕上成功下载,在第二个屏幕上用几乎相同的代码获得错误   java调用super。超级的方法,跳过超级。方法   使用Web服务连接到sharepoint 2013的Java应用程序   java我无法正确呈现editText   httpurlconnection如何在java中检查url连接状态   java Spring Security可以为同一用户接受多个密码吗?   java如何在PreparedStatement中使用自动生成的@Id?   java每个数组表示一个位模式   java我不确定如何记录鼠标在某个区域被点击的次数   spring如何解决:java。lang.NoSuchMethodError:javax。坚持不懈实体管理器。createStoredProcedureQuery(Ljava/lang/String;)   java如何为blackberry中listfield项内的不同字段触发事件   安卓使用Proguard混淆java代码   java在grails 2中与多个数据源有一个和一个域关联。十、   java在尝试在单击按钮时返回combobox值时一直出错   java我可以在setter中使用@Resource注释而不是字段吗?   java Eclipse调试步进不工作   java比较相同对象的两个表并选择不同的表