biotoolkit包含gc from dna:分析fasta文件中dna序列的gc含量

biotoolkit的Python项目详细描述


biotoolkit包含:

gc from dna.py



序列的gc内容。
此模块格式化每个序列名(用下划线替换空格),计算每个序列的
GC内容百分比,并将此数据保存为一个CSV文件,其中包含修改后的原始文件名版本(例如,fasta_file_1.fa-->;fasta_file_1_gc.csv)。

gcfromdna利用biopython包的一部分进行分析。包
可以使用以下命令安装:

$pip install biotython


要安装biotoolkit:

$pip install biotoolkit


成功安装后,可以使用以下命令将模块导入新的python脚本:

下面是一个完整的python脚本,它将调用模块的功能:

\!/usr/bin/env python
从biotoolkit导入gcfromdna
gcfromdna.compute()

可以将fasta文件名作为参数直接传递给计算函数。
文件名必须作为列表传递给计算函数:

gcfromdna.compute([file1,file2,file3])如果file1='file1.fa',例如

gcfromdna可以交互使用。在命令行中,输入:

$python
>;>from biotoolkit import gcfromdna
>;>gcfromdna.compute()


可选文件名参数必须用空格分隔:





$python gcfromdna.py*.fa

如果未提供文件名,程序将提示用户从fasta文件(位于当前目录中的
)中选择进行处理。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
相对于框架java窗口的鼠标位置错误   Java 8流peek api   java将数据附加到文件中   java使用ExoPlayer 2.8播放播放列表中的特定文件   JavaSpring国际化:如何动态设置语言环境值   java如何在mysql中实现两个表之间的两个关联   java在gradle可执行jar文件中包含运行时参数   surefire插件中的java maven多套测试套件   java试图理解堆分析以确定内存泄漏或所需的大量内存   java识别字符串有数字   数组如何解决错误“java.lang.ArrayIndexOutOfBoundsException:5”   java Swt文件对话框选择的文件太多?   java此登录代码易受SQL注入攻击吗?   Java[3]中的文件<identifier>预期编译错误   java如何在spring webflux中发送列表   jar中未找到java文件异常   如何在java中合并2D数组?   java如何评测本机JNI库