使用Python从HTML代码获取验证码url

-1 投票
1 回答
1734 浏览
提问于 2025-04-30 11:24

我需要从这个网页获取验证码的链接:

这是上面网站的一部分HTML代码,其中包含验证码的链接:

<span id="recaptcha_image"></span></p><p><label></label><span>
<a href="javascript:Recaptcha.reload ();" id="recaptcha_reload_btn"></a>
</span></p>

但是我无法做到这一点,因为验证码的链接看起来像是JavaScript代码。

javascript:Recaptcha.reload ();

那么我该如何使用Python获取这个链接呢?希望有人能帮我。

谢谢

暂无标签

1 个回答

0

一般来说,你可以使用一些网页驱动工具来点击验证码按钮,然后获取生成的HTML代码。在Python中,你可以使用splinter,它是基于selenium的一个更简单的工具,使用起来很方便,虽然还有很多类似的选择。

不过,我担心你可能忽略了一些基本的东西。验证码其实并没有一个真正的“网址”。这个“网址”通常是在一个链接元素中,用来触发一些JavaScript代码,生成实际的验证码HTML(可能里面没有链接,但有一张图片)。如果你想要的是这个,那么我上面提到的方法会对你有帮助。如果不是的话,我就不太明白你的问题了。

更新

其实并没有什么“验证码网址”,所以这就像是在追逐影子一样。验证码在这个特定的网页上是以图片的形式存在。你提到的那个网址是用来重新生成验证码的,实际上并不是真正的一个网址,而是一种触发预先编写的JavaScript函数的方法。

如果你是想点击它来重新生成图片,那么上面的方法是正确的。如果你想获取图片的src,那么你还是得先生成图片,然后获取HTML并解析出这个src。

祝你好运!

撰写回答