Python抓取错误MissingSchema:无效的URL

2024-04-25 21:52:12 发布

您现在位置:Python中文网/ 问答频道 /正文

有人知道为什么会出错吗?在

MissingSchema: Invalid URL '/type/gymnasien/': No schema supplied. Perhaps you meant http:///type/gymnasien/?

这是我的代码:

^{pr2}$

Tags: no代码youhttpurlschematypeinvalid
1条回答
网友
1楼 · 发布于 2024-04-25 21:52:12

根据我从你的代码中了解到的情况,你需要抓取一堆学校的链接,然后使用get_emails()函数来跟踪这些链接,然后刮取学校的联系电子邮件。如果您查看传递给get_emails()results列表,您将看到它包含一些站点内部的相关链接,requests不知道如何处理:

>>> print(results[1])
/type/gymnasien/

这些链接可能不是您想要访问的链接,因此您可以在将它们传递给您的get_emails()函数之前,尝试将它们从已删除的链接列表中删除:

^{pr2}$

然后您可以在下游使用这些结果,get_emails()不应该再抱怨{}。最终代码如下:

^{3}$

它打印以下输出:

['schule@waldorfschulemarburg.de', 'e-gym@schulen-ee.de', 'martina.kock@louisenlund.de', 'gymnasium.sn@ecolea.de', 'admissions@dresden-is.de', 'info@sankt-matthias.de', 'info@marienhoehe.de', 'kubera@ams-viernheim.de', 'gymnasium.hro@ecolea.de']

相关问题 更多 >