Python中文
首页
教程
问答
标签
搜索
登录
注册
python,通过坐标从DAS获取序列
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p><a href="http://genome.ucsc.edu/cgi-bin/das/hg19/dna?segment=chr20:30037432,30038060" rel="nofollow">ucsc DAS server</a>,通过坐标得到DNA序列。在</p> <p>网址:<a href="http://genome.ucsc.edu/cgi-bin/das/hg19/dna?segment=chr20:30037432,30038060" rel="nofollow">http://genome.ucsc.edu/cgi-bin/das/hg19/dna?segment=chr20:30037432,30038060</a></p> <p>示例文件:</p> <pre><code><DASDNA> <SEQUENCE id="chr20" start="30037832" stop="30038060" version="1.00"> <DNA length="229"> gtggcacccaaagatgctggaatctttatggcaaatgccgttacagatgc tccaagaaggaaagagtctatgtttactgcataaataataaaatgtgctg cgtgaagcccaagtaccagccaaaagaaaggtggtggccattttaactgc tttgaagcctgaagccatgaaaatgcagatgaagctcccagtggattccc acactctatcaataaacacctctggctga </DNA> </SEQUENCE> </DASDNA> </code></pre> <p>我想要的是这个部分:</p> ^{pr2}$ <p>我想从数千个这样的网址序列部分,我应该怎么做? 我试图将数据写入文件并解析该文件,它工作正常,但是有没有任何方法可以直接解析类似xml的字符串?我试过其他帖子中的一些例子,但都没用。在</p> <p><strong>在这里,我添加了我的解决方案。感谢下面的两个答案。</strong></p> <p><strong>解决方案1:</strong></p> <pre><code>def getSequence2(chromosome, start, end): base = 'http://genome.ucsc.edu/cgi-bin/das/hg19/dna?segment=' url = base + chromosome + ':' + str(start) + ',' + str(end) doc = etree.parse(url,parser=etree.XMLParser()) if doc != '': sequence = doc.xpath('SEQUENCE/DNA/text()')[0].replace('\n','') else: sequence = 'THE SEQUENCE DOES NOT EXIST FOR GIVEN COORDINATES' return sequence </code></pre> <p><strong>解决方案2:</strong></p> <pre><code>def getSequence1(chromosome, start, end): base = 'http://genome.ucsc.edu/cgi-bin/das/hg19/dna?segment=' url = base + chromosome + ':' + str(start) + ',' + str(end) xml = urllib2.urlopen(url).read() if xml != '': w = open('temp.xml', 'w') w.write(xml) w.close() dom = parse('temp.xml') data = dom.getElementsByTagName('DNA') sequence = data[0].firstChild.nodeValue.replace('\n','') else: sequence = 'THE SEQUENCE DOES NOT EXIST FOR GIVEN COORDINATES' return sequence </code></pre> <p>当然,他们需要导入一些必要的库。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>使用像<a href="http://lxml.de/" rel="nofollow">lxml</a>这样的pythonxml解析库,用该解析器加载XML文件,然后使用选择器(例如使用XPath)获取所需的节点/元素。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
Python从点数组计算平均多边形
2 回答
python从点集创建计数网格
8 回答
python从父对象实例化子实例
6 回答
python从父目录“\uu init\uu.py”fi导入
7 回答
python从父目录导入.json文件
4 回答
Python从父目录导入并保持flake8愉快
4 回答
Python从父目录导入模块,Flask Unittest示例
5 回答
Python从父目录相对导入
4 回答
Python从父目录运行子进程
1 回答
Python从父类继承变量
5 回答
Python从父级相对导入搜索路径
10 回答
Python从父线程/主线程与子线程的多线程交互
2 回答
Python从父静态方法调用子静态变量
4 回答
Python从特定lin写入文件
7 回答
Python从特定ord中的列表中检索值
2 回答
Python从特定ord中的列表调用函数
7 回答
Python从特定位置的列表中减去一个数字
4 回答
python从特定位置读取二进制文件
10 回答
Python从特定函数捕获警告消息
9 回答
Python从特定列写入csv numb
2 回答