从KeGG路径文档中提取复合名称

import pandas as pd import urllib from io import StringIO import re def get_KeGG_pathways_cpds(organism = 'eco'): orgURL = 'http://rest.kegg.jp/list/pathway/' orgStr = urllib.request.urlopen(orgURL + organism).read().decode('utf-8') orgIO = StringIO(orgStr) orgDf = pd.read_csv(orgIO, sep='\t', names = ['pway', 'description']) pathURL = 'http://rest.kegg.jp/get/' for pway in orgDf.pway: pathStr = urllib.request.urlopen(pathURL + pway).read().decode('utf-8') compounds = re.findall('(C[0-9]{5})', pathStr) print(compounds) print('-------------------------\n') return get_KeGG_pathways_cpds()

1条回答

网友

1楼 · 发布于 2024-05-19 01:36:18

import requests


listed = requests.get('http://rest.kegg.jp/list/pathway/')
listed =  listed.text.split('\n') # Remove the last one which is empty
for l in listed:
     result = requests.get('http://rest.kegg.jp/get/{}'.format(l.split('\t')[0])    
     #do_thing_with_result_here(result)
     print(result.text)

这表明：入口map00010通道名称糖酵解/糖异生说明糖酵解是促进。。。。。。 ....... 你知道吗

其余的路径，我不会复制到这里。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章