从不带超链接的url读取json文件

2024-04-20 06:14:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用以下命令来提取嵌入在the following webpage中的信息:(最终我要做的是提取上述网页中显示的数据帧中的信息)。你知道吗

import urllib.request, json 
with urllib.request.urlopen("https://www.mitomap.org/foswiki/bin/view/MITOMAP/MutationsRNA") as url:
    data = url.read().decode()

然而,我们可以看到,在数据帧中有许多超链接。以列Locus为例。如果我在Locus下打印观察结果,它将显示如下:

"<a href='/MITOMAP/GenomeLoci#MTTF'>MT-TF</a>"

表示是超链接。尽管如此,我还是希望在最后一个数据帧中显示文本(在本例中MT-TF)。你知道吗

是否有任何参数可以传递给urllib.request.urlopen()仅提取文本(而不是超链接)或任何其他方法?你知道吗


Tags: the数据文本命令信息urlrequesttf