蛋白质具有聚集性和变异性。
proteofav的Python项目详细描述
蛋白质特征聚集和变异
proteofav是一个python模块,它解决了交叉定位蛋白质结构和蛋白质序列的难题, 允许用序列特征注释蛋白质结构。它实现了使用 蛋白质结构(通过mmcif、pdb、pdb验证、dssp和sifts文件)、序列特征(通过uniprot gff注释)和 遗传变异(通过uniprot/ebi蛋白api和ensembl rest api)。结构和序列的交叉映射是 在筛子的帮助下进行
ProteFAV非常依赖Pandas库来快速地将数据加载到数据帧中 数据勘探和分析。结构和顺序 数据被解析/提取到pandas数据帧中,然后合并(折叠)到 单个数据帧。
开始
在虚拟环境中从源安装
获取蛋白质组:
$ wget https://github.com/bartongroup/ProteoFAV/archive/master.zip -O ProteoFAV.zip
$ unzip ProteoFAV.zip
# alternatively, cloning the git repository
$ git clone https://github.com/bartongroup/ProteoFAV.git
使用conda安装:
$ conda-env create -n proteofav -f path/to/ProteoFAV/requirements.txt $ source activate proteofav $ cd path/to/ProteoFAV $ pip install .
使用Virtualenv安装:
$ virtualenv --python `which python` env $ source env/bin/activate $ pip install -r requirements.txt $ python path/to/ProteoFAV/setup.py install
测试安装
测试依赖项应通过以下方式解析:
$ python path/to/ProteoFAV/setup.py develop --user
使用以下命令运行测试:
$ python path/to/ProteoFAV/setup.py test# or $ cd path/to/ProteoFAV/tests $ python -m unittest discover
蛋白质组化
ProteoFAV使用一个配置文件config.ini,用户可以在其中指定目录路径以及常用数据源的url
安装后运行:
$ proteofav-setup
示例用法
示例用法当前作为Jupyter笔记本提供,可以使用GitHub’s文件查看器或Jupyter nbviewer查看
您可以从GitHub下载jupyter笔记本,并使用proteofav的安装进行测试。
学分
参见Credits
变更日志
许可
麻省理工学院的执照。有关详细信息,请参见license。