我有一个问题,我正在努力解决。我有一个大约25000个基因的大数据集,这些基因似乎是域改组或基因融合的产物。我想在pdf格式的基础上查看MT6输出这些路线
我为这些基因中的每一个都有一个序列(重组双基因)的BLAST输出文件,以及不同数量的受试基因,其列如下: qseqid sseqid evalue qstart qend qlen sstart send slen长度 我希望通过一些代码来解析这些文件,以生成像附件一样的图像,使用以下示例blast输出文件:
Cluster_1___Hsap10003 Cluster_2___Hsap00200 1e-30 5 100 300 10 105 240 95
Cluster_1___Hsap10003 Cluster_2___Hsap00200 1e-10 200 230 300 205 235 30 95
Cluster_1___Hsap10003 Cluster_3___Aver00900 1e-20 5 100 300 10 105 125 100
Cluster_1___Hsap10003 Cluster_3___Atha00809 1e-20 5 110 300 5 115 120 105
Cluster_1___Hsap10003 Cluster_4___Ecol00002 1e-10 70 170 300 205 235 30 95
Cluster_1___Hsap10003 Cluster_4___Ecol00003 1e-30 75 175 300 10 105 240 95
Cluster_1___Hsap10003 Cluster_4___Sfle00009 1e-10 80 180 300 205 235 30 95
Cluster_1___Hsap10003 Cluster_5___Spom00010 1e-30 160 260 300 10 105 240 95
Cluster_1___Hsap10003 Cluster_5___Scer01566 1e-10 170 270 300 205 235 30 95
Cluster_1___Hsap10003 Cluster_5___Afla00888 1e-30 175 275 300 10 105 240 95
我希望查询序列是一个粗的彩色条,每个主题的对齐部分是粗的彩色条,带有细黑线,显示基因长度的其余部分(每行一个主题,显示查询的所有对齐部分)
有人知道任何软件或github代码可以做这样的事情吗
非常感谢
目前没有回答
相关问题 更多 >
编程相关推荐