如何从存储在请求url中的html代码字符串中提取信息?

2024-05-23 14:45:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我想要一份SLC政治的所有捐赠者的名单以及他们的地址。我不想等待我的开放记录请求,我只想把它删掉。我没有使用原始url,而是使用了请求url,但随后它会打开一个html代码字符串,我不知道如何从中提取信息

我检查了网页(https://dotnet.slcgov.com/Attorneys/CampaignFinance_Public/#/Contributors),其中载有不同的SLC政治捐助者的信息。很明显,我不能使用上面的url进行抓取,因为如果我不点击任何字母,它不会显示任何内容,所以我在选择了一个后打开了请求url,例如。 所以我得到的url变成了:https://dotnet.slcgov.com/Attorneys/CampaignFinance_Public/api/CampaignFinanceAPI/GetContributorsByStartingIndex?pIndexCharacter=A 好像我可以一起工作。 但是第二个url会打开一个纯代码字符串,每个捐赠者的信息列表作为一个单独的项目。我以前从来没有想过要从中摆脱出来。如何分解代码并告诉python我希望将每一行分开并存储到不同的单元格中?有办法做到这一点吗


Tags: 字符串代码httpscom信息urlpublic政治