一个小的示例包
projest的Python项目详细描述
项目
由[Esther Vendrell]制作
上次更新时间:2019年7月
简介
projest是我的第一个程序。包括介绍一种蛋白质的名称,并获得关于它作为最相似蛋白质的信息,它所具有的不同模型或原子。您可以获得的所有信息都来自:https://www.rcsb.org/
说明
主文件是protein.py。尽管主要功能是提取原子信息。py-负载蛋白pdb或负载蛋白fasta-其余功能是蛋白质。 这样,我们将具有与蛋白质直接相关的功能,如: protein(“2ki5”)。get_similar_protein()->;我们将获得fasta文件、pdb文件、mongodb中的所有蛋白质信息(在init中)以及每个链的类似蛋白质。
功能
有7个功能:
- 获取氨基酸序列:在蛋白质中。返回包含链和氨基酸序列(1个字母)的列表。从fasta文件。
- 获取蛋白质链。返回一个具有不同链的列表。
- 获取氨基酸清单:蛋白质。返回一个含有不同氨基酸(3个字母)的列表,这些氨基酸的序列号按链分类
- 获取与蛋白质相似的蛋白质。返回包含不同链和该链中最相似蛋白质的字典。
- 通用词典:蛋白质。任何回报。它在MongoDB中插入所有分类的信息。它是不可调用的。
- 负载蛋白质PDB:提取原子信息。返回蛋白质的pdb文件。将蛋白质的pdb文件下载到文件的同一目录中。
- 载入蛋白质:提取原子信息。返回蛋白质的fasta文件,将蛋白质的fasta文件下载到文件的同一目录下。
MongoDB
我可以使用其他结构将所有信息上传到MongoDB: 蛋白质-模型-残基序列-原子-信息原子。
班级模式: definit(self,model_identifier,model_dict): self.model_identifier=模型标识符 self.chain_list=[] 对于链标识符,model_dict中的值: self.chain_list.append(链(链标识符))
这样我们就可以从MongoDB获得信息。这会更容易,但我还没有足够的时间,因为我已经意识到。
我的项目结构是: portein-model-remusion-name-remusion-sequence-number-element-name-atom-name-information-atom。
这更容易理解我们得到的信息并对其进行分类。这就是为什么我用这个结构。视觉效果更好,但在内部获取这些信息则更糟。