用机器学习预测蛋白质热稳定性的python包。
ThermoProt的Python项目详细描述
Thermoprot是一种利用机器学习来预测嗜冷、中温、嗜热或超嗜热蛋白质热稳定性的工具。
如果您觉得Thermoprot有帮助,请引用本文:
Gado,J.E.,Beckham,G.T.,Payne,C.M.(2019年)。蛋白质热稳定性预测 使用机器学习。
安装
使用pip安装
pip install thermoprot
先决条件
- Python3
- sklearn
- 努比
- 熊猫
用法
ThermoProt有两个主要功能:
- seqpred:预测单个蛋白质序列的热稳定性。
- fastapred:在fasta文件中预测蛋白质序列的热稳定性,并将预测作为pandas数据帧返回。
示例
importthermoprotastp# Predict thermostability of a sequenceseq="MVRVPRERSGTRSALGEASTYPVGAMTSQHDDQMTFYEAVGGEETFTRLA"pred=tp.seqPred(seq,clf='MTH',probability=False)# clf can be PM, MT, TH or MTH# Predict thermostability of sequences in fasta file and write results to spreadsheetfasta_file='sequences.fas'df=tp.fastaPred(fasta='sequences.fas',clf='MTH')df.to_csv('predictions.csv')# Write to spreadsheet