从多序列比对中删除离群序列
pysickle的Python项目详细描述
pysickel.py将尝试从多序列比对(msa)中删除导致不对中的序列。它以多个fasta格式读取给定的msa,并删除具有最高惩罚分数的序列,然后构建没有这些序列的下一个msa。重复此过程,直到达到用户指定的截止值,或者只剩下不到三个序列要对齐。
用法:
###################################### # pysickle.py ###################################### usage: pysickle.py -f multifasta alignment options: -f, --fasta=FILE multifasta alignment (eg "align.fas") OR -F, --fasta_dir=DIR directory with multifasta files (needs -s SUFFIX) -s, --suffix=SUFFIX will try to work with files that end with SUFFIX (eg ".fas") -a, --msa_tool=STR supported: "mafft" [default:"mafft"] -i, --max_iterations=NUM force stop after NUM iterations -n, --num_threads=NUM max number of threads to be executed in parallel [default: 1] -h, --help prints this
当前支持的多序列对齐器:
- mafft(katoh,standley 2013(分子生物学与进化30:772-780))mafft多序列比对软件版本7:性能和可用性的改进。http://mafft.cbrc.jp/alignment/software/)
要求
- matplotlib
- 努比
外部程序
- 马夫特