BCBio的GFF解析器问题

0 投票
1 回答
989 浏览
提问于 2025-04-16 16:10

我正在尝试使用BCBio的GFF解析器来解析一个GFF文件,但遇到了以下错误。有没有人能帮我解决这个问题?

错误追踪(最近的调用在最前面):

 File "gff_parse.py", line 6, in <module>
    for rec in GFF.parse(in_handle):
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 709, in parse
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 299, in parse_in_parts
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 320, in parse_simple
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 603, in _gff_process
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 634, in _lines_to_out_info
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 183, in _gff_line_map
ValueError: invalid literal for int() with base 10: 'New Start'

这是我的代码:

from BCBio import GFF    
in_file = "infile.gff"    
in_handle = open(in_file)
for rec in GFF.parse(in_handle):
    print rec
in_handle.close()

谢谢,
Tulika

1 个回答

2

你是怎么生成这个GFF文件的?看起来里面至少有一行是无效的。第四列应该是一个整数,用来表示某个特征的起始坐标;但是错误信息显示它的值是'New Start',这显然不对。

GFF3规范页面上有一些有效GFF的例子,而在线验证工具可以帮助你解决像这样的格式问题。

撰写回答