biotoolkit包含gc from dna:分析fasta文件中dna序列的gc含量
biotoolkit的Python项目详细描述
biotoolkit包含:
gc from dna.py
序列的gc内容。
此模块格式化每个序列名(用下划线替换空格),计算每个序列的
GC内容百分比,并将此数据保存为一个CSV文件,其中包含修改后的原始文件名版本(例如,fasta_file_1.fa-->;fasta_file_1_gc.csv)。
gcfromdna利用biopython包的一部分进行分析。包
可以使用以下命令安装:
$pip install biotython
要安装biotoolkit:
$pip install biotoolkit
成功安装后,可以使用以下命令将模块导入新的python脚本:
下面是一个完整的python脚本,它将调用模块的功能:
\!/usr/bin/env python
从biotoolkit导入gcfromdna
gcfromdna.compute()
可以将fasta文件名作为参数直接传递给计算函数。
文件名必须作为列表传递给计算函数:
gcfromdna.compute([file1,file2,file3])如果file1='file1.fa',例如
gcfromdna可以交互使用。在命令行中,输入:
$python
>;>from biotoolkit import gcfromdna
>;>gcfromdna.compute()
可选文件名参数必须用空格分隔:
$python gcfromdna.py*.fa
如果未提供文件名,程序将提示用户从fasta文件(位于当前目录中的
)中选择进行处理。
gc from dna.py
此模块格式化每个序列名(用下划线替换空格),计算每个序列的
GC内容百分比,并将此数据保存为一个CSV文件,其中包含修改后的原始文件名版本(例如,fasta_file_1.fa-->;fasta_file_1_gc.csv)。
gcfromdna利用biopython包的一部分进行分析。包
可以使用以下命令安装:
$pip install biotython
要安装biotoolkit:
$pip install biotoolkit
成功安装后,可以使用以下命令将模块导入新的python脚本:
下面是一个完整的python脚本,它将调用模块的功能:
\!/usr/bin/env python
从biotoolkit导入gcfromdna
gcfromdna.compute()
可以将fasta文件名作为参数直接传递给计算函数。
文件名必须作为列表传递给计算函数:
gcfromdna.compute([file1,file2,file3])如果file1='file1.fa',例如
gcfromdna可以交互使用。在命令行中,输入:
$python
>;>from biotoolkit import gcfromdna
>;>gcfromdna.compute()
可选文件名参数必须用空格分隔:
$python gcfromdna.py*.fa
如果未提供文件名,程序将提示用户从fasta文件(位于当前目录中的
)中选择进行处理。